浏览项目
-
-
-
agent paper / 微软开源OmniParser
Creative Commons Attribution 4.0 International基于纯视觉的屏幕解析工具,旨在通过AI技术将用户界面(UI)截图转换为结构化数据
主题: 人工智能更新于 -
-
-
-
papers top / 伯克利论文大模型优化SkyThought
Apache License 2.0伯克利顶级论文《LLMs Can Easily Learn to Reason from Demonstrations Structure, not content, is what matters!》
更新于 -
具有分层 RL 算法的革命性推理扩展范式:为 32B 模型提供 500 个思维模板,在推理任务中优于 o1-preview 和 DeepSeek-V3。
更新于 -
-
-
-
na tures / 香港科大LLaSA_training
Creative Commons Attribution Non Commercial 4.0 International基于 Llama 的 语音合成:基于 LLaMA 的语音合成扩展训练
更新于 -
-
-
-
-
-
-
-