전체 글62 LibriSpeech 기반 ResNet, DenseNet, 그리고 앙상블 모델 개발기 서론: 음성 데이터를 활용한 딥러닝 프로젝트 이 프로젝트는 지난 2021년에 진행한 프로젝트이다. 당시 대학원 졸업 논문 주제를 고민하다가 LibriSpeech 데이터셋을 사용하여 음성 데이터를 기반으로 하는 ResNet, DenseNet 모델을 학습시키고, 이를 앙상블하여 성능을 향상하는 프로젝트를 진행하기로 결정했다.이번 포스팅에서는 (매우 늦은 감이 있지만) 당시 프로젝트를 진행하며 겪은 다양한 오류와 해결 과정을 정리하고자 한다. 딥러닝 기반 음성 인식 모델을 구현하는 과정에서 발생하는 문제들을 어떻게 해결했는지 공유하기 위함이다.1. LibriSpeech 데이터셋과 전처리 과정1.1 LibriSpeech 데이터셋LibriSpeech는 읽기 음성 데이터를 포함한 대규모 ASR(Auto Speech.. 2025. 1. 30. DeepSeek 가 던진 충격 : 우리는 무엇을 놓치고 있었을까. 며칠 전에 DeepSeek 가 발표한 R1 모델 관련 글을 썼고, 오픈소스와 연관 지어서 앞으로 AI 업계의 미래를 예측해 보았는데 내 생각보다 너무나 빠른 속도로 충격파가 발생하고 있다. 오늘 DeepSeek 에서 이미지 생성 및 분석이 가능한 또다른 오픈소스 AI 모델인 Janus-pro 를 공개하였고 역시나 OpenAI 의 DALL-E 를 능가하는 성능을 보여주었다. 그리고 엔비디아의 주가가 17% 폭락했다. 이와 같은 성능이 가능한 이유, 그리고 엔비디아가 폭락하는 이유가 무엇일까. 먼저 배경부터 설명하자면, 현재 최첨단 AI 모델을 훈련시키는 비용은 엄청나게 비싼 상황이다.OpenAI, Anthropic 같은 회사들은 계산에만 1억 달러 이상을 쓰며, 4만 달러짜리 GPU 수천 대가 필요한 대.. 2025. 1. 29. [React Native] Invariant Violation: "main" has not been registered. React Native 프로젝트에서 파일 호출 순서는 package.json의 main 필드와 index.js 파일의 설정에 따라 달라진다.일반적으로 Expo 또는 React Native 앱의 실행 흐름은 다음과 같다.1. package.json 확인package.json 파일의 "main" 필드가 앱의 진입점(entry point)을 결정하며, 기본적으로 다음과 같이 설정되어 있어야 한다."main": "index.js" 즉, index.js 파일이 먼저 호출된다.2. index.js 파일의 역할index.js 파일은 프로젝트의 진입점(entry point)으로, AppRegistry를 사용해 앱의 루트 컴포넌트를 등록한다.index.js 예시:import { AppRegistry } from 'rea.. 2025. 1. 28. Working in public : 오픈소스의 미래 DeepSeek 이 OpenAI 의 o1 급 성능의 AI 모델의 오픈소스와 개발방식을 공개했다. 이제 누구나 o1 급 AI 모델에 자체적으로 학습을 시킬 수 있는 시대가 도래한 것이다. 자세한 성능 데이터는 아래 표에서 확인 가능한데, 작은 크기의 AI 모델에서 큰 모델의 지식 Distill 을 통해 경쟁력 있는 성능을 이끌어 내는 것이 가능하다는 기술적인 포인트가 매우 흥미롭다. 게다가 이렇게 오픈소스로 공개하게 되면, 이를 기반으로 한 AI 서비스들은 마치 스마트폰의 안드로이드가 그러했듯이 우리 일상에 더욱 빠른 속도로 침투하게 될 것이다. 뿐만 아니라 지금까지 미국의 AI 기업들이 기술공개에 주저 했던 것이 결국 발목을 잡으면서, 현재 AI 오픈소스를 주도하고 있는 중국이 AI 패권을 잡게 될 가능.. 2025. 1. 25. NVIDIA 가 공개한 월드모델? Cosmos 그게 뭐죠? CES 2025 행사의 NVIDIA 키노트에 다녀왔다. 사실 미국에 온 이후 가장 기대했던 이벤트가 CES 였던 만큼 너무나 만족스러운 경험이었다. 경험에 대한 후일담은 다른 글에서 다루기로 하고, 이번 NVIDIA 키노트는 세상을 이해하는 월드 파운데이션 모델인 "Cosmos" 와 함께 "Omniverse" 플랫폼, 그리고 자율주행과 로봇 공학 등 다양한 응용 사례를 중심으로 진행되었다. NVIDIA가 이번 발표에서 강조한 핵심은 물리적 AI 와 이를 구현하는 새로운 플랫폼인 "Cosmos" 인데, "Cosmos" 는 물리적 세계의 데이터를 학습하고 예측하며 시뮬레이션할 수 있는 AI 기술을 제공한다. 간단히 말하면 NVIDIA가 개발한 세계 기반 모델로, 하나의 거대한 플랫폼이다. (*세계 기반 모.. 2025. 1. 14. Farewell, 2024 정말이지 다사다난 했던 한 해가 저물어 가고 있다. 특히나 12월은, 45년만의 계엄으로 시작해서 너무나도 안타까운 참사로 마무리 되었다는 것이 믿어지지 않는다.눈을 감으면 사고 장면이 계속해서 떠오른다. 얼마나 무섭고 고통스러웠을지 짐작조차 되지 않는다. 그럼에도 불구하고 우리는 계속해서 살아나가야 한다.지금 당장은 모든 것이 혼란스럽고 불투명해 보이겠지만, 자연이 언제나 무한한 회복력을 통해 재생하고 질서를 바로 잡아 나가듯이 우리의 세상도 버릴 것은 버리고 정리할 것은 정리하며 서서히 제자리를 찾아가는 법이다. 매년 한 해를 되돌아보고 새로운 해의 계획을 세우는 작업을 진행해오고 있다.2024년의 나는 무엇보다 미국에 오기 전과 후로 나눌 수 밖에 없을 것 같다. 한국에서의 생활을 되돌아보면 아무래.. 2025. 1. 14. 이전 1 2 3 4 ··· 11 다음