10 月 30 日,全球首个专为粤语而设的动态评测平台及生态系统 CLEVA-Cantonese 推出。凤凰卫视旗下人工智能数据服务机构——凤凰智媒为其提供了第一批高质量粤语数据。这个创新平台通过提供公平、动态且具参考价值的基准评估,揭示各类大语言模型对粤语的支持程度,并为研究人员及开发者提供具参考价值的分析,加速粤语大语言模型的优化及实际应用。
此前,港中大语言与视觉实验室研发的 CLEVA 是目前公认规模最大、涵盖最全面的中文大语言模型评估基准之一。CLEVA-Cantonese 在此基础上,建立全球首个持续演进的粤语大语言模型评估生态系统。
粤语是香港、广东及海外华人生活地区的重要语言,但由于粤语语音语义的繁复多样、口语和文字的巨大差异、以及独特的文化背景等原因造成大模型对粤语的理解和支持能力较为欠缺。同时,粤语是低资源语言,语料库有限,所以收集更多高质量的数据,是提升大模型能力的基础条件。

