韩国两大运营商开源韩语AI模型-icspec

韩国两大运营商开源韩语AI模型

来源:李智衍发布时间:13 小时前

分享至微信

据韩媒《ET News》和《韩国经济》报道，韩国运营商SK Telecom（SKT）与韩国电信（KT）分别推出了自主研发的大型语言模型（LLM），并以开源形式公开。这两款模型在韩语处理及文化理解方面表现优异，甚至在部分基准测试中超越了GPT-4o。

2025年7月3日，SKT宣布将其LLM模型“A.X 4.0”发布至开源AI开发者平台Hugging Face。同一天，KT也将自家的超大规模AI模型“Mi:dm 2.0”公开在该平台上。两款模型均针对韩语优化，适用于韩国本土商业环境。

SKT的“A.X 4.0”基于中国阿里巴巴开源模型Qwen 2.5开发，并通过大规模韩语数据训练，显著提升了韩语处理能力。此外，SKT自主设计了分词器（Tokenizer），使模型在韩语处理效率上比GPT-4o高出约33%。在韩语能力评估基准测试KMMLU中，“A.X 4.0”得分为78.3分，高于GPT-4o的72.5分；在韩语及韩国文化基准测试CLiCK中，其得分为83.5分，同样优于GPT-4o的80.2分。

为满足不同用户需求，“A.X 4.0”提供两种版本：标准模型拥有72B参数，轻量模型则为7B参数。此外，SKT计划通过本地部署（on-premise）方式提供该模型，确保数据安全和网络安全。

KT的“Mi:dm 2.0”则包含两个版本：“Mi:dm 2.0 Base”和“Mi:dm 2.0 Mini”。其中，“Mi:dm 2.0 Base”拥有115亿参数，适合通用服务场景，尤其在韩国特殊知识和问答任务中表现突出；“Mi:dm 2.0 Mini”是基于Base模型蒸馏而成的小型模型，参数约为23亿，支持韩语和英语。

据透露，KT通过使用韩国教育图书、文学作品以及多领域数据，对“Mi:dm 2.0”进行了深度训练，并开发了符合韩语语言特性的分词器。在衡量韩语理解能力的基准测试KMMLU和HAERAE中，“Mi:dm 2.0”表现优于国际主流开源模型。

icspec【芯片求购】https://www.icspec.com/inquiry/index/1/0

[ 新闻来源：李智衍，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]