斯坦福大学和华盛顿大学联合发布AI训练方法S1,利用极简测试时缩放技术提升语言模型推理能力,实现性能飞跃。
微软发布Phi-4模型,开源MIT协议,训练数据9.8T,支持16K上下文,强化调整确保指令遵守和安全。
微软发布Phi-4,小参数模型超越GPT-4等,表现优异,已开源支持商业用途。
InfAlign:谷歌DeepMind研发的机器学习框架,通过校准强化学习提升语言模型推理胜率,显著改善AI系统对齐。