UPDATED. 2024-05-20 17:44 (월)
플리토-업스테이지, AI 언어 데이터 구축 위한 업무협약 체결
플리토-업스테이지, AI 언어 데이터 구축 위한 업무협약 체결
  • 박진우 기자
  • 승인 2024.05.09 09:52
  • 댓글 0
이 기사를 공유합니다

아시아권역 저자원 언어 수집 및 데이터셋 구축 협력
기업용 언어모델 시장에서 경쟁력 강화
사진=플리토
사진=플리토

[한국M&A경제] 인공지능(AI) 언어 데이터 기업 플리토(대표 이정수)는 AI 기술 기업 업스테이지와 AI 언어 데이터 구축을 위한 업무협력 협약(MOU)을 체결했다고 9일 밝혔다. 

양사는 초거대 언어모델(LLM) 성능 향상을 위해 태국어, 일본어, 베트남어, 라오스어, 크메르어 등과 같은 아시아권역 저자원 언어 수집 및 데이터셋 구축 협력을 해 나아갈 예정이다. 

체결된 협약 사항은 ▲한국어 LLM 리더보드 ‘Ko-LLM’ 벤치마크 데이터셋 구축 협력 ▲다국어 LLM 리더보드 운영 협력 ▲저자원 언어 데이터 구축 및 저자원 언어 활용을 통한 LLM 현지화 ▲기업 도입 소형언어모델(sLLM) 구축에 따른 데이터 공급 파트너십 강화 등을 골자로 한다. 언어를 기반으로 한 양사의 AI 개발 협력이 향후 가시적인 성과를 나타낼 것으로 전망된다. 

플리토는 이번 협약을 바탕으로 언어 데이터와 AI 기술 간의 시너지를 통해 언어 모델의 고도화에 적극적으로 기여할 뿐 아니라 다국어 병렬 말뭉치 구축 노하우와 저작권 이슈가 없는 텍스트∙이미지∙음성데이터셋을 통해 자사 언어 수집 기술 경쟁력을 높인다는 계획이다. 

업스테이지는 이를 통해 고품질의 저자원 언어 데이터를 확보하고 자사의 사전학습 LLM 솔라의 지원 언어를 더욱 확장해 동남아시아 등 다양한 지역별 언어에 특화된 맞춤형 모델을 개발하겠다는 전략이다. 솔라는 현재 한국어, 영어를 지원하며, 연내 일본어와 태국어까지 지원 언어를 확대할 예정이다. 

이정수 플리토 대표는 “저자원 언어 학습분야는 LLM 성능의 핵심 요소로 부상했다”며 “양사 협력을 통해 고품질 데이터와 고도화된 기술 간의 접목이 국내 생성형 AI 생태계에 얼마나 긍정적인 기여를 할 수 있는지 보이자고 한다”고 말했다. 

김성훈 업스테이지 대표는 “언어모델로 촉발된 생성형 AI 열풍이 전 세계를 뒤흔들고 있는 상황에서 양질의 언어 데이터 확보는 필수적인 과제”라며 “업스테이지는 이번 플리토와의 협력을 통해 전세계 더 많은 사람이 생성형 AI 혁신을 경험할 수 있도록 데이터 고도화에 나설 것”이라고 밝혔다. 

[한국M&A경제=박진우 기자] pjw@kmnanews.com



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.