记录团队成长点滴以及对技术、理念的探索,同时我们乐于分享!

3523
qwen3-0.6B这种小模型有什么实际意义和用途吗?

2025-06-17 查看(1000)

0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务
3523
如何评价Google刚刚发布的 Gemini Diffusion? 会代替自回归模型成为下一代模型吗?

2025-06-17 查看(1000)

首先谷歌的 llm diffusion 和之前发布的 llm
3523
为什么说男人至死都是少年?

2025-06-17 查看(1000)

老公38岁。 今天晚上回来看到洗手台上堆好多石头,我刚开始
3523
为什么这次以色列打伊朗,网上声讨的人少了,反而都是嘲笑调侃伊朗?

2025-06-18 查看(1000)

站在中国的角度,伊朗完全不值得同情,伊朗我也是去过的,虽然是
3523
为什么openai的sdk只提供了python和js两个版本?

2025-06-17 查看(1000)

国内把JAVA当主流,不代表国外也把JAVA捧在手心里。
3523
golang为什么要内置map?

2025-06-18 查看(1000)

学太多的坏处就想太多。 Go 从一开始就不是一个想很多的语