记录团队成长点滴以及对技术、理念的探索,同时我们乐于分享!
-
- qwen3-0.6B这种小模型有什么实际意义和用途吗?
- 0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务
2025-06-17 查看(1000)
-
- 如何评价Google刚刚发布的 Gemini Diffusion? 会代替自回归模型成为下一代模型吗?
- 首先谷歌的 llm diffusion 和之前发布的 llm
2025-06-17 查看(1000)
-
- 为什么说男人至死都是少年?
- 老公38岁。 今天晚上回来看到洗手台上堆好多石头,我刚开始
2025-06-17 查看(1000)
-
- 为什么这次以色列打伊朗,网上声讨的人少了,反而都是嘲笑调侃伊朗?
- 站在中国的角度,伊朗完全不值得同情,伊朗我也是去过的,虽然是
2025-06-18 查看(1000)
-
- 为什么openai的sdk只提供了python和js两个版本?
- 国内把JAVA当主流,不代表国外也把JAVA捧在手心里。
2025-06-17 查看(1000)
-
- golang为什么要内置map?
- 学太多的坏处就想太多。 Go 从一开始就不是一个想很多的语
2025-06-18 查看(1000)