AI 시장 경쟁이 빠르게 치열해지는 가운데, 중국 바이두가 최근 열린 ‘바이두 월드’ 행사에서 차세대 모델 ‘에르니(Ernie) 5.0’을 선보였다.
바이두 최고기술책임자이자 AI그룹 총괄인 왕하이펑은 에르니 5.0의 기술적 방향이 “네이티브 풀 멀티모달 모델링을 위한 통합 자기회귀(auto regression) 아키텍처를 채택하는 것”이라면서, “훈련 초기 단계부터 음성과 이미지, 비디오, 오디오 등 다양한 멀티모달 데이터가 모두 통합돼 있다”라고 설명했다.
이전 버전인 ‘에르니-4.5-VL-28B-A3B-Thinking’이 아파치 라이선스로 공개돼 오픈AI 같은 모델을 모델을 대체할 개방형 선택지로 기대를 모은 것과는 달리, 에르니 5.0은 바이두의 딥러닝 프레임워크 ‘패들패들(PaddlePaddle)’에 기반해 자체 모델로 구축됐다.
바이두는 서면 자료에서 에르니 5.0 프리뷰 버전이 업계에서 널리 활용되는 벤치마크 기관인 LM아레나의 텍스트 리더보드에서 공동 2위(현재 8위)를 기록했다고 밝혔다.
다만 인포테크 리서치 그룹 연구 책임자 토머스 랜들은 다소 회의적인 반응을 보였다. 랜들은 “에르니 업데이트가 글로벌 차원의 게임체인저라고 보기는 어렵다”라며 “다른 AI 모델을 능가한다거나 ‘동급’이라는 주장은 독립된 벤치마크와 여러 언어 및 기능에서 폭넓게 검증이 이뤄져야 한다”라고 말했다. 그는 “멀티모달 지원 자체는 의미가 있지만, 결국 중요한 것은 실제 성능이며 에르니가 다른 모델과 본질적으로 얼마나 차이가 나는지는 아직 알 수 없다”라고 지적했다.
IDC 연구 책임자 브랜던 호프는 바이두가 멀티모달 중심 전략을 강화하고 있는 점에 주목했다. 그는 바이두가 시각 처리, STEM 기반 추론, 비주얼 그라운딩처럼 특수성이 강한 영역에 초점을 맞추고 있으며, 이러한 분야는 각각의 목적과 성격이 다른 만큼 전문적인 접근이 필요하다고 설명했다. 그는 “이 작업들은 각각 성격이 다른 워크로드이며 활용 목적도 다르다. 이를 처리하는 모델들은 점점 더 지능화되고 있다”라고 언급했다.
호프는 이를 오픈AI의 방식과 비교하며 “오픈AI는 다양한 프롬프트를 처리하는 LLM 기반 챗봇 중심 전략을 취하고 있다”라고 설명했다.
이어 그는 이번 발표가 AI 분야의 변화 속도를 보여주는 사례라고 진단했다. 그는 “AI가 새로운 사용례로 확장되면서 앞으로도 이런 종류의 발표는 계속 나올 것이며, 이 흐름은 일종의 자연스러운 전개 과정이자 예상된 발전 단계라고 볼 수 있다”라고 말했다. 또한 그는 “중국에는 전 세계 AI 개발자의 절반가량이 있기 때문에 중국에서 앞으로 다양한 혁신이 계속 나올 것으로 봐야 한다”라고 언급했다.
하지만 휴스턴 홈 툴스 설립자이자 AI 연구자인 아메드 하르하라는 바이두의 전략이 중국어 환경과 현지 데이터에 최적화돼 있다고 평가했다. 그는 “구글이 영어 중심 데이터셋에 맞춰 바드(제미나이)를 미세 조정하는 방식과 비슷하다. 실제로 차이를 만드는 요소는 모델 아키텍처 자체가 아니라, 각 기업이 처한 학습 환경과 규제 조건”이라고 분석했다.
하르하라는 AI에서 지리적 요인에 따른 미세 조정의 중요성이 과소평가돼 왔다고 지적했다. 그는 “이 부분은 생각보다 훨씬 중요하다. 모델이 뉘앙스와 편향, 문맥을 해석하는 방식 자체가 달라진다”라고 설명했다. 이어 “바이두의 강점은 원시 모델 성능이 아니라 중국 디지털 생태계와 검색 인프라와의 통합에서 나올 가능성이 크다”라고 진단했다.
바이두 총괄부사장 션두는 이번 행사에서 AI 역량 강화를 위한 신규 프로세서 2종을 발표했다. 대규모 AI 추론에 최적화된 ‘쿤룬신(Kunlunxin) M100’은 2026년 초 출시될 예정이며, 대규모 멀티모달 모델의 학습과 추론을 지원하도록 설계된 ‘M300’은 2027년 초 발표될 계획이다.
바이두는 이 두 프로세서 외에도 ‘천치(Tianchi) 256’과 ‘천치 512’ 슈퍼노드를 함께 공개했다. 회사 측은 두 제품이 2026년 공식 출시될 예정이라고 설명하면서, 천치 512 슈퍼노드는 쿤룬신 P800 칩 512개로 구성돼 최대 1조 개 파라미터 규모 모델의 학습이 가능하다고 밝혔다.
호프는 바이두가 자체 워크로드에 맞춘 칩을 설계하는 방식이 미국 주요 클라우드 업체들의 행보와 유사하다고 설명했다. 그는 “중국 기업은 미국산 AI 플랫폼에 접근할 수 없기 때문에 현지에서 개발한 기술에 집중할 수밖에 없으며, 이 전략이 일정 부분 성과를 낼 것으로 보인다”라고 말했다.
그는 미국의 대중 수출 규제가 분명한 영향을 미치고 있다고 분석했다. 이러한 제한으로 인해 중국이 미국산 하드웨어가 아니라 중국 자체 하드웨어 플랫폼을 기반으로 AI 인프라를 구축하고 있다는 설명이다. 호프는 “이는 미국의 기술 리더십에 위협이 될 수 있다. 화웨이는 이미 여러 국가와 긴밀한 관계를 맺고 있으며 자사 솔루션으로 성과를 낼 가능성이 크다. 이런 흐름을 고려하면 화웨이와 바이두가 미국 외 지역에서 미국 기업의 강력한 경쟁자로 자리할 가능성이 높다”라고 전망했다.
dl-ciokorea@foundryco.com
Read More from This Article: 바이두, 멀티모달 강화한 차세대 에르니 AI 공개···분석가들이 본 향후 전망
Source: News

