Forwarded from Machinelearning
Π Π°Π·ΠΌΠ΅Ρ β 1 ΡΡΠΈΠ»Π»ΠΈΠΎΠ½ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ², ΠΏΡΠΈ ΡΡΠΎΠΌ:
- 65.8% Π½Π° SWE-bench Verified, ΠΏΡΠΎΡΠΈΠ² 50.2% Ρ Claude Sonnet 4 ΠΈ 40.8% Ρ GPT-4.1
- ΠΡΡΡΠΈΠ΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ ΡΡΠ΅Π΄ΠΈ ΠΎΡΠΊΡΡΡΡΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΏΠΎ ΠΊΠΎΠ΄ΠΈΠ½Π³Ρ, ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΠΊΠ΅ ΠΈ Π°Π³Π΅Π½ΡΠ½ΡΠΌ Π·Π°Π΄Π°ΡΠ°ΠΌ
- ΠΡΡ ΠΈΡΠ΅ΠΊΡΡΡΠ° MoE Π½Π° Π±Π°Π·Π΅ DeepSeek V3, 1 ΡΡΠ»Π½ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ², 32B Π°ΠΊΡΠΈΠ²Π½Ρ.
Π’Π°ΠΊΠΆΠ΅ Π΄ΠΎΡΡΡΠΏΠ½Π° ΡΠ΅ΡΠ΅Π· API:
- $0.15 Π·Π° ΠΌΠΈΠ»Π»ΠΈΠΎΠ½ Π²Ρ ΠΎΠ΄Π½ΡΡ ΡΠΎΠΊΠ΅Π½ΠΎΠ² (ΠΏΡΠΈ ΠΏΠΎΠΏΠ°Π΄Π°Π½ΠΈΠΈ Π² ΠΊΡΡ)
- $0.60 Π·Π° ΠΌΠΈΠ»Π»ΠΈΠΎΠ½ Π²Ρ ΠΎΠ΄Π½ΡΡ ΡΠΎΠΊΠ΅Π½ΠΎΠ² (Π΅ΡΠ»ΠΈ ΠΊΡΡ Π½Π΅ ΡΡΠ°Π±ΠΎΡΠ°Π»)
- $2.50 Π·Π° ΠΌΠΈΠ»Π»ΠΈΠΎΠ½ Π²ΡΡ ΠΎΠ΄Π½ΡΡ ΡΠΎΠΊΠ΅Π½ΠΎΠ²
ΠΠΎΡΡΠΈ Π² 5 ΡΠ°Π· Π΄Π΅ΡΠ΅Π²Π»Π΅, ΡΠ΅ΠΌ Claude 4 Sonnet ΠΈ Gemini 2.5 Pro!
@ai_machinelearning_big_data
#kimi #china #llm #ml #ai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
π₯8β€5π4
Forwarded from ΠΠΈΡΠ°ΠΉ.AI
π Kimi K2: ΠΠΈΡΠ°ΠΉΡΠΊΠΈΠΉ Π³ΠΈΠ³Π°Π½Ρ ΠΠ ΠΎΡΠ²Π΅ΡΠ°Π΅Ρ Π½Π° Π²ΡΠ·ΠΎΠ² DeepSeek ΠΎΡΠΊΡΡΡΠΎΠΉ SOTA-ΠΌΠΎΠ΄Π΅Π»ΡΡ Ρ 1 ΡΡΠ»Π½ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ²
ΠΠΎΡΠ»Π΅ ΠΏΠΎΠ»ΡΠ³ΠΎΠ΄Π° ΠΌΠΎΠ»ΡΠ°Π½ΠΈΡ ΠΊΠΈΡΠ°ΠΉΡΠΊΠ°Ρ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΡ MoonshotAI ΠΏΡΠ΅Π΄ΡΡΠ°Π²ΠΈΠ»Π° ΠΌΠΎΡΠ½ΡΡ Π°Π»ΡΡΠ΅ΡΠ½Π°ΡΠΈΠ²Ρ DeepSeek β ΠΌΠΎΠ΄Π΅Π»Ρ Kimi K2 Ρ ΡΠ°Π·Π²ΠΈΡΡΠΌΠΈ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡΠΌΠΈ Π² ΠΊΠΎΠ΄ΠΈΠ½Π³Π΅, ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΠΊΠ΅ ΠΈ Π°Π²ΡΠΎΠΌΠ°ΡΠΈΠ·Π°ΡΠΈΠΈ Π·Π°Π΄Π°Ρ.
π ΠΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ Π·Π²Π΅Π·Π΄ Π½Π° GitHub ΡΠΆΠ΅ ΠΏΡΠ΅Π²ΡΡΠΈΠ»ΠΎ 3k!
π₯ ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΠΈ:
β’ ΠΡΡ ΠΈΡΠ΅ΠΊΡΡΡΠ° MoE (Mixture of Experts) Ρ 1 ΡΡΠΈΠ»Π»ΠΈΠΎΠ½ΠΎΠΌ ΠΎΠ±ΡΠΈΡ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ² (Π°ΠΊΡΠΈΠ²Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ 32 ΠΌΠ»ΡΠ΄)
β’ ΠΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° ΠΊΠΎΠ½ΡΠ΅ΠΊΡΡΠ°
β’ ΠΡΠΊΡΡΡΡΠΉ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΉ ΠΊΠΎΠ΄ (ΠΌΠΎΠ΄ΠΈΡΠΈΡΠΈΡΠΎΠ²Π°Π½Π½Π°Ρ MIT-Π»ΠΈΡΠ΅Π½Π·ΠΈΡ)
β’ ΠΡΡΡΠΈΠ΅ ΠΏΠΎΠΊΠ°Π·Π°ΡΠ΅Π»ΠΈ ΡΡΠ΅Π΄ΠΈ ΠΎΡΠΊΡΡΡΡΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² ΡΠ΅ΡΡΠ°Ρ SWE Bench, Tau2, AceBench
π‘ Π§Π΅ΠΌ ΡΠ΄ΠΈΠ²ΠΈΠ» Kimi K2?
β ΠΠ΅Π½Π΅ΡΠ°ΡΠΈΡ 3D-Π»Π°Π½Π΄ΡΠ°ΡΡΠΎΠ² Ρ ΡΠΈΠΊΠ»ΠΎΠΌ Π΄Π΅Π½Ρ/Π½ΠΎΡΡ
β ΠΠ²ΡΠΎΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΠΏΠ»Π°Π½ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ ΡΠ»ΠΎΠΆΠ½ΡΡ Π·Π°Π΄Π°Ρ (Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΠΎΡΠ³Π°Π½ΠΈΠ·Π°ΡΠΈΡ ΠΏΠΎΠ΅Π·Π΄ΠΊΠΈ Π½Π° ΠΊΠΎΠ½ΡΠ΅ΡΡ)
β Π‘ΠΈΠ»ΡΠ½Π°Ρ ΡΡΠΎΡΠΎΠ½Π° β Π³Π΅Π½Π΅ΡΠ°ΡΠΈΡ ΠΊΠΎΠ΄Π° (ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»ΠΈ Π½Π°Π·ΡΠ²Π°ΡΡ "DeepSeek-ΠΌΠΎΠΌΠ΅Π½ΡΠΎΠΌ" Π΄Π»Ρ coding ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ)
π§ Π’Π΅Ρ Π½ΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΠΈΠ½Π½ΠΎΠ²Π°ΡΠΈΠΈ:
β’ ΠΠΎΠ²ΡΠΉ ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΎΡ Muon Π²ΠΌΠ΅ΡΡΠΎ ΡΡΠ°Π΄ΠΈΡΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ Adam
β’ Π‘ΠΈΡΡΠ΅ΠΌΠ°
β’ ΠΠ±ΡΡΠ΅Π½ΠΈΠ΅ Π½Π° 15.5T ΡΠΎΠΊΠ΅Π½ΠΎΠ² Π±Π΅Π· Π°Π½ΠΎΠΌΠ°Π»ΠΈΠΉ (zero loss spike)
β’ Π‘Π°ΠΌΠΎΠΎΡΠ΅Π½ΠΎΡΠ½ΡΠΉ ΠΌΠ΅Ρ Π°Π½ΠΈΠ·ΠΌ (self-judging) Π΄Π»Ρ Π·Π°Π΄Π°Ρ Π±Π΅Π· ΡΠ΅ΡΠΊΠΈΡ ΠΊΡΠΈΡΠ΅ΡΠΈΠ΅Π²
π ΠΡΠΊΡΡΡΠ°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ Π΄ΠΎΡΡΡΠΏΠ½Π° Π² Π΄Π²ΡΡ Π²Π°ΡΠΈΠ°Π½ΡΠ°Ρ :
- Kimi-K2-Base (Π±Π°Π·ΠΎΠ²Π°Ρ)
- Kimi-K2-Instruct (Π΄Π»Ρ Agent-Π·Π°Π΄Π°Ρ)
GitHub | Huggingface
#ΠΠΈΡΠ°ΠΉΡΠΊΠΈΠΉΠΠ #ΠΠΈΡΠ°ΠΉAI #MoonshotAI #Kimi
ΠΠΎΡΠ»Π΅ ΠΏΠΎΠ»ΡΠ³ΠΎΠ΄Π° ΠΌΠΎΠ»ΡΠ°Π½ΠΈΡ ΠΊΠΈΡΠ°ΠΉΡΠΊΠ°Ρ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΡ MoonshotAI ΠΏΡΠ΅Π΄ΡΡΠ°Π²ΠΈΠ»Π° ΠΌΠΎΡΠ½ΡΡ Π°Π»ΡΡΠ΅ΡΠ½Π°ΡΠΈΠ²Ρ DeepSeek β ΠΌΠΎΠ΄Π΅Π»Ρ Kimi K2 Ρ ΡΠ°Π·Π²ΠΈΡΡΠΌΠΈ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡΠΌΠΈ Π² ΠΊΠΎΠ΄ΠΈΠ½Π³Π΅, ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΠΊΠ΅ ΠΈ Π°Π²ΡΠΎΠΌΠ°ΡΠΈΠ·Π°ΡΠΈΠΈ Π·Π°Π΄Π°Ρ.
π ΠΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ Π·Π²Π΅Π·Π΄ Π½Π° GitHub ΡΠΆΠ΅ ΠΏΡΠ΅Π²ΡΡΠΈΠ»ΠΎ 3k!
π₯ ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΠΈ:
β’ ΠΡΡ ΠΈΡΠ΅ΠΊΡΡΡΠ° MoE (Mixture of Experts) Ρ 1 ΡΡΠΈΠ»Π»ΠΈΠΎΠ½ΠΎΠΌ ΠΎΠ±ΡΠΈΡ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ² (Π°ΠΊΡΠΈΠ²Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ 32 ΠΌΠ»ΡΠ΄)
β’ ΠΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° ΠΊΠΎΠ½ΡΠ΅ΠΊΡΡΠ°
128K ΡΠΎΠΊΠ΅Π½ΠΎΠ²β’ ΠΡΠΊΡΡΡΡΠΉ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΉ ΠΊΠΎΠ΄ (ΠΌΠΎΠ΄ΠΈΡΠΈΡΠΈΡΠΎΠ²Π°Π½Π½Π°Ρ MIT-Π»ΠΈΡΠ΅Π½Π·ΠΈΡ)
β’ ΠΡΡΡΠΈΠ΅ ΠΏΠΎΠΊΠ°Π·Π°ΡΠ΅Π»ΠΈ ΡΡΠ΅Π΄ΠΈ ΠΎΡΠΊΡΡΡΡΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² ΡΠ΅ΡΡΠ°Ρ SWE Bench, Tau2, AceBench
π‘ Π§Π΅ΠΌ ΡΠ΄ΠΈΠ²ΠΈΠ» Kimi K2?
β ΠΠ΅Π½Π΅ΡΠ°ΡΠΈΡ 3D-Π»Π°Π½Π΄ΡΠ°ΡΡΠΎΠ² Ρ ΡΠΈΠΊΠ»ΠΎΠΌ Π΄Π΅Π½Ρ/Π½ΠΎΡΡ
β ΠΠ²ΡΠΎΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΠΏΠ»Π°Π½ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ ΡΠ»ΠΎΠΆΠ½ΡΡ Π·Π°Π΄Π°Ρ (Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΠΎΡΠ³Π°Π½ΠΈΠ·Π°ΡΠΈΡ ΠΏΠΎΠ΅Π·Π΄ΠΊΠΈ Π½Π° ΠΊΠΎΠ½ΡΠ΅ΡΡ)
β Π‘ΠΈΠ»ΡΠ½Π°Ρ ΡΡΠΎΡΠΎΠ½Π° β Π³Π΅Π½Π΅ΡΠ°ΡΠΈΡ ΠΊΠΎΠ΄Π° (ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»ΠΈ Π½Π°Π·ΡΠ²Π°ΡΡ "DeepSeek-ΠΌΠΎΠΌΠ΅Π½ΡΠΎΠΌ" Π΄Π»Ρ coding ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ)
π§ Π’Π΅Ρ Π½ΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΠΈΠ½Π½ΠΎΠ²Π°ΡΠΈΠΈ:
β’ ΠΠΎΠ²ΡΠΉ ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΎΡ Muon Π²ΠΌΠ΅ΡΡΠΎ ΡΡΠ°Π΄ΠΈΡΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ Adam
β’ Π‘ΠΈΡΡΠ΅ΠΌΠ°
MuonClip Π΄Π»Ρ ΡΡΠ°Π±ΠΈΠ»ΡΠ½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ Π½Π° ΡΡΠΈΠ»Π»ΠΈΠΎΠ½Π°Ρ
ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ²β’ ΠΠ±ΡΡΠ΅Π½ΠΈΠ΅ Π½Π° 15.5T ΡΠΎΠΊΠ΅Π½ΠΎΠ² Π±Π΅Π· Π°Π½ΠΎΠΌΠ°Π»ΠΈΠΉ (zero loss spike)
β’ Π‘Π°ΠΌΠΎΠΎΡΠ΅Π½ΠΎΡΠ½ΡΠΉ ΠΌΠ΅Ρ Π°Π½ΠΈΠ·ΠΌ (self-judging) Π΄Π»Ρ Π·Π°Π΄Π°Ρ Π±Π΅Π· ΡΠ΅ΡΠΊΠΈΡ ΠΊΡΠΈΡΠ΅ΡΠΈΠ΅Π²
π ΠΡΠΊΡΡΡΠ°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ Π΄ΠΎΡΡΡΠΏΠ½Π° Π² Π΄Π²ΡΡ Π²Π°ΡΠΈΠ°Π½ΡΠ°Ρ :
- Kimi-K2-Base (Π±Π°Π·ΠΎΠ²Π°Ρ)
- Kimi-K2-Instruct (Π΄Π»Ρ Agent-Π·Π°Π΄Π°Ρ)
GitHub | Huggingface
#ΠΠΈΡΠ°ΠΉΡΠΊΠΈΠΉΠΠ #ΠΠΈΡΠ°ΠΉAI #MoonshotAI #Kimi
β€1