语言模型新闻

过度训练大型语言模型可能会使它们更难进行微调

来自美国卡内基梅隆大学、斯坦福大学、哈佛大学和普林斯顿大学的人工智能研究小组发现，如果大型语言模型过度训练，可能会使其更难进行微调。该小组在arXiv预印本服务器上发表的论文比较了不同训练量对单个法学硕士(LLM)的影响。过去几年，随着人工智能研究人员不断提升产品性能，使其更加智能，许多人都秉持着这样的信条：模型训练得越多，最终效果就越好。在这项新研究中，研究团队发现了一些证据表明，语言模型训练可能存在收益递减点。研究人员在...

04-26

上一页 1 2 3 4 5 6 7 8 9 10 ... 334 下一页

语言模型新闻

过度训练大型语言模型可能会使它们更难进行微调

推荐阅读