【财新网】
零一万物回应“抄袭” 发布yi-34b训练过程说明
11月15日,对其大模型yi-34b训练过程进行说明,称训练模型过程中沿用了gpt/llama的基本架构,且基本上国际主流大模型都是基于transformer的架构,大模型持续发展与寻求突破口的核心点不仅在于架构,而是在于训练得到的参数。近日,hugging face开发者质疑旗下 ai企业零一万物开源大模型抄袭了meta的llama架构,只对两个张量名称进行修改。零一万物开源团队总监richard lin称,在大量训练实验过程中,由于实验执行需求对代码做了更名,将尊重开源社区的反馈,将代码进行更新,也更好的融入transformer生态。