韩国两大运营商开源韩语AI模型
来源:李智衍 发布时间:13 小时前 分享至微信
据韩媒《ET News》和《韩国经济》报道,韩国运营商SK Telecom(SKT)与韩国电信(KT)分别推出了自主研发的大型语言模型(LLM),并以开源形式公开。这两款模型在韩语处理及文化理解方面表现优异,甚至在部分基准测试中超越了GPT-4o。

2025年7月3日,SKT宣布将其LLM模型“A.X 4.0”发布至开源AI开发者平台Hugging Face。同一天,KT也将自家的超大规模AI模型“Mi:dm 2.0”公开在该平台上。两款模型均针对韩语优化,适用于韩国本土商业环境。

SKT的“A.X 4.0”基于中国阿里巴巴开源模型Qwen 2.5开发,并通过大规模韩语数据训练,显著提升了韩语处理能力。此外,SKT自主设计了分词器(Tokenizer),使模型在韩语处理效率上比GPT-4o高出约33%。在韩语能力评估基准测试KMMLU中,“A.X 4.0”得分为78.3分,高于GPT-4o的72.5分;在韩语及韩国文化基准测试CLiCK中,其得分为83.5分,同样优于GPT-4o的80.2分。

为满足不同用户需求,“A.X 4.0”提供两种版本:标准模型拥有72B参数,轻量模型则为7B参数。此外,SKT计划通过本地部署(on-premise)方式提供该模型,确保数据安全和网络安全。

KT的“Mi:dm 2.0”则包含两个版本:“Mi:dm 2.0 Base”和“Mi:dm 2.0 Mini”。其中,“Mi:dm 2.0 Base”拥有115亿参数,适合通用服务场景,尤其在韩国特殊知识和问答任务中表现突出;“Mi:dm 2.0 Mini”是基于Base模型蒸馏而成的小型模型,参数约为23亿,支持韩语和英语。

据透露,KT通过使用韩国教育图书、文学作品以及多领域数据,对“Mi:dm 2.0”进行了深度训练,并开发了符合韩语语言特性的分词器。在衡量韩语理解能力的基准测试KMMLU和HAERAE中,“Mi:dm 2.0”表现优于国际主流开源模型。

[ 新闻来源:李智衍,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!