第118章 有电,任性 (3 / 16)
一路走来,他有机会就会收集各类书籍,如今终于开始派上用场。
异界的通用语是一种字母语言,其体系结构与地球上的拉丁文极为相似。地球的专家组已经针对性地对模型进行了优化。
大模型中,也植入了中文相关的数据,如今加入了异界通用语的语料。但距离实现翻译,还欠缺关键的平行语料库。
为此,工程师设计了一套方案。由苏冥提供一个“种子词典”,标注出一千个核心词汇在两种语言间的对应关系。大模型以此作为语义空间的坐标锚点,通过向量对齐技术,实现翻译功能。
具体的算法原理,苏冥根本就无从理解,他只是被告知,预计的训练周期大约需要一周。
内容未完,下一页继续阅读