기사상세페이지

알리바바 "검색엔진 사용 않는 AI훈련 개발…비용 88% 절감"

기사입력 2025.05.13 00:36

SNS 공유하기

fa tw gp
  • ba
  • ka ks url


    알리바바 검색엔진 사용 않는 AI훈련 개발.jpg


    중국 빅테크(거대 정보기술기업) 알리바바가 외부 검색엔진을 사용하지 않는 새로운 인공지능(AI) 훈련 방법을 개발했다고 홍콩 사우스차이나모닝포스트(SCMP)가 12일 알리바바의 최신 논문을 인용해 보도했다.


    논문 공개 사이트 아카이브(arXiv) 등에 발표된 이 논문에 따르면 구글 등에 고가의 API(응용 프로그램 인터페이스) 비용을 지불하지 않고도 정보검색 능력을 훈련할 수 있는 '제로서치'라는 새로운 강화학습 방식으로 훈련비용을 90% 정도 절감할 수 있는 것으로 나타났다.


    알리바바 연구진은 논문에서 "효과적인 정보 검색은 대규모언어모델(LLM)의 추론과 생성 기능을 향상하는 데 필수적이지만, 검색엔진의 문서 품질을 예측할 수 없어 강화학습(RL) 과정에 불안정성을 초래하고 수십만 건의 검색 요청 등이 필요해 상당한 API 비용을 발생시킨다"고 지적했다.


    연구진은 "이런 문제를 해결하기 위해 실제 검색엔진과 상호작용하지 않고도 LLM의 검색 능력을 훈련할 수 있는 '제로서치'를 도입했다"고 밝혔다.


    '제로서치' 방식은 간단한 지도미세조정(supervised fine-tuning)을 통해 LLM을 검색 모듈로 변환해 쿼리(질의)에 대한 응답으로 관련성 있는 문서와 노이즈 문서를 모두 생성하도록 한다.


    이후 강화학습 훈련 중에는 전략적으로 문서의 품질을 점진적으로 낮추고 더 까다로운 검색 시나리오에 노출시켜 추론 능력을 향상시켰다.


    연구진은 '제로서치' 실험을 통해 70억 매개변수(파라미터) 검색 모듈은 실제 검색엔진 기반 모델과 비슷한 성능을 달성했고, 14억 매개변수 모듈은 성능이 더 뛰어났다고 주장했다.



    특히 구글 검색 API를 활용해 6만4천건의 질의를 처리하려면 586.7달러(약 82만1천원)의 비용이 들지만, 엔비디아의 A100 그래픽처리장치(GPU) 4개로 구성된 14B 모델에서 훈련하는 비용은 70.8달러로 88%의 비용 절감 효과를 얻을 수 있다고 강조했다.


    SCMP는 이런 연구 결과는 AI 검색을 발전시키려는 알리바바의 노력과 궤를 같이한다고 밝혔다.


    알리바바는 지난 9일 중국에서 가장 많이 사용되는 AI 앱인 '쿼크'의 향상된 AI 검색 기능을 공개한 바 있다.


    쿼크 팀은 "이 기능은 알리바바의 AI 모델 큐원의 추론 능력을 온라인 검색과 통합해 복잡한 질의에 정확한 응답을 제공한다"고 설명했다. (연합뉴스 협약)

    backward top home