CBA

未开始

新疆

04-29

广州

CBA

未开始

浙江

04-29

上海

CBA

未开始

广东

04-28

广厦

CBA

未开始

辽宁

04-28

深圳

CBA

未开始

上海

04-26

浙江

CBA

未开始

广州

04-26

新疆

CBA

未开始

深圳

04-25

辽宁

CBA

未开始

广厦

04-25

广东

CBA

未开始

广州

04-24

新疆

CBA

未开始

上海

04-24

浙江

CBA

未开始

深圳

04-23

辽宁

CBA

未开始

广厦

04-23

广东

西甲第32轮

未开始

皇马

04-22

巴萨

法甲第30轮

未开始

大巴黎

04-22

里昂

西甲第32轮

未开始

阿拉维斯

04-22

马竞

英超第34轮

未开始

富勒姆

04-21

利物浦

德甲第30轮

未开始

多特蒙德

04-21

勒沃库森

CBA

未开始

新疆

04-21

广州

中超第7轮

未开始

北京国安

04-21

青岛西海岸

CBA

未开始

浙江

04-21

上海

中超第7轮

未开始

梅州客家

04-21

上海海港

NBA

未开始

湖人

04-21

掘金

美职联第9轮

未开始

迈阿密国际

04-21

纳什维尔SC

NBA

未开始

太阳

04-21

森林狼

西甲第32轮

未开始

吉罗纳

04-21

加的斯

英超第34轮

未开始

狼队

04-21

阿森纳

沙特联第28轮

未开始

哈森姆

04-21

吉达联合

NBA

未开始

魔术

04-21

骑士

意甲第33轮

未开始

恩波利

04-21

那不勒斯

中超第7轮

未开始

南通支云

04-20

上海申花

CBA

未开始

辽宁

04-20

深圳

CBA

未开始

广东

04-20

广厦

中超第7轮

未开始

成都蓉城

04-20

深圳新鹏城

中超第7轮

未开始

山东泰山

04-20

沧州雄狮

意甲第33轮

未开始

卡利亚里

04-20

尤文

沙特联第28轮

未开始

利雅得胜利

04-19

费哈

CBA

未开始

新疆

04-19

广州

CBA

未开始

浙江

04-19

上海

欧联1/4决赛

未开始

罗马

04-19

米兰

欧联1/4决赛

未开始

西汉姆联

04-19

勒沃库森

欧联1/4决赛

未开始

马赛

04-19

本菲卡

欧联1/4决赛

未开始

亚特兰大

04-19

利物浦

CBA

未开始

广东

明日

广厦

CBA

未开始

辽宁

明日

深圳

NBA

未开始

老鹰

明日

公牛

NBA

未开始

热火

明日

76人

欧冠1/4决赛

未开始

曼城

明日

皇马

欧冠1/4决赛

未开始

拜仁

明日

阿森纳

NBA

已结束

勇士

94

国王

NBA

已结束

湖人

110

鹈鹕

欧冠1/4决赛

已结束

巴萨

1

大巴黎

欧冠1/4决赛

已结束

多特蒙德

4

马竞

U23亚洲杯第1轮

已结束

韩国U23

1

阿联酋U23

U23亚洲杯第1轮

已结束

日本U23

1

中国U23

CBA

已结束

上海

118

北京

英超第33轮

已结束

切尔西

6

埃弗顿

CBA

已结束

深圳

117

北控

CBA

已结束

广厦

109

山西

NBA

已结束

火箭

116

快船

NBA

已结束

掘金

126

灰熊

NBA

已结束

独行侠

86

雷霆

NBA

已结束

湖人

124

鹈鹕

NBA

已结束

爵士

116

勇士

NBA

已结束

活塞

95

马刺

NBA

已结束

太阳

125

森林狼

NBA

已结束

开拓者

82

国王

意甲第32轮

已结束

国米

2

卡利亚里

NBA

已结束

老鹰

115

步行者

NBA

已结束

公牛

119

尼克斯

NBA

已结束

奇才

122

凯尔特人

NBA

已结束

猛龙

103

热火

NBA

已结束

雄鹿

88

魔术

NBA

已结束

黄蜂

120

骑士

NBA

已结束

篮网

86

76人

意甲第32轮

腰斩

乌迪内斯

1

罗马

CBA

已结束

广州

92

青岛

CBA

已结束

北京

116

上海

CBA

已结束

山西

132

广厦

CBA

已结束

北控

99

深圳

CBA

已结束

青岛

96

广州

CBA

已结束

上海

110

北京

CBA

已结束

深圳

106

北控

CBA

已结束

广厦

107

山西

CBA

已结束

上海

95

浙江

CBA

已结束

广州

109

南京

CBA

已结束

山西

117

北控

CBA

已结束

山东

128

宁波

CBA

已结束

深圳

102

北京

CBA

已结束

新疆

121

江苏

CBA

已结束

吉林

107

福建

CBA

已结束

青岛

87

四川

CBA

已结束

天津

113

广东

CBA

已结束

辽宁

101

广厦

刚刚，Kimi开源底层推理框架，1小时GitHub揽星1.2k

2024-11-28 15:56:56

什么？Kimi底层推理架构刚刚宣布：开！源！了！

你没听错，就是那个承载了Kimi线上80%以上流量的架构。

大约几小时前，月之暗面Kimi联合清华大学等机构，开源了大模型推理架构Mooncake。

根据官方介绍，本次开源将采用分阶段的方式：

逐步开源高性能KVCache多级缓存Mooncake Store的实现，同时针对各类推理引擎和底层存储/传输资源进行兼容。
其中传输引擎Transfer Engine现在已经在GitHub全球开源。

可以看到，Mooncake一经开源，已在GitHub狂揽1.2k star。

其最终开源目标是，为大模型时代打造一种新型高性能内存语义存储的标准接口，并提供参考实现方案。

月之暗面Kimi工程副总裁许欣然表示：

通过与清华大学MADSys实验室紧密合作，我们共同打造了分离式大模型推理架构Mooncake，实现推理资源的极致优化。
Mooncake不仅提升了Kimi的用户体验，降低了成本，还为处理长文本和高并发需求提供了有效的解决方案。
我们相信，通过与产学研机构开源合作，可以推动整个行业向更高效的推理平台方向发展。

实际上，这个项目早在今年6月就已启动，当时已受到业内广泛关注——

大模型推理架构Mooncake

今年6月，月之暗面和清华大学MADSys实验室联合发布了Kimi底层的Mooncake推理系统设计方案。

在这篇名为《Mooncake: A KVCache-centric Disaggregated Architecture for LLM Serving》的论文中，作者详细介绍了Mooncake这种系统架构。

该系统基于以KVCache为中心的PD分离和以存换算架构，大幅度提升了推理吞吐。

具体而言，Mooncake采用以KVCache为中心的解耦架构，将预填充集群与解码集群分离，并充分利用GPU集群中未充分利用的CPU、DRAM和SSD资源，实现KVCache的解耦缓存。

其核心在于以KVCache为中心的调度程序：

在最大化整体有效吞吐量和满足与延迟相关的服务级别目标 (SLO) 要求之间取得平衡

当面对流量高峰期时，Mooncake通过早期拒绝策略和预测未来负载的方法，来处理超载问题。

早期拒绝策略（Early Rejection Policy）

简单说，其核心思想是在请求实际开始处理之前，根据当前系统的负载情况预测是否有足够的资源来处理新的请求。

如果预测结果表明系统资源不足以保证请求的及时处理，系统就会在请求到达之前予以拒绝，从而避免了无效的资源占用和不必要的延迟。

预测未来负载（Predicting Future Load）

在Mooncake中，系统需要能够预测在未来一段时间内的负载情况，以便做出更准确的接受或拒绝请求的决策。

如何实现呢？？

通常来说，这种预测会基于当前的请求模式、系统的资源使用情况以及历史数据等信息。

再通过对信息的进一步分析建模，Mooncake就能够估计接下来的请求处理需求，并据此调整其调度策略。

论文实验结果显示，与基线方法相比，Mooncake在某些模拟场景中可以实现高达525%的吞吐量提升，同时遵守SLO（与延迟相关的服务级别目标)。

在实际工作负载下，Mooncake使Kimi能够处理75%以上的请求。

而且据许欣然在其他场合透露：

目前这套系统承载了Kimi线上80%以上的流量。

而现在，为了进一步加速该技术框架的应用与推广，Kimi联合清华大学等机构共同发布开源项目Mooncake。

参与开源的首批阵容包括：

AISoft、阿里云、华为存储、面壁智能、趋境科技等。

可以说，云计算、存储、AI模型玩家等产学研力量都聚齐了。

据悉，Mooncake开源项目从论文延伸，以超大规模KVCache缓存池为中心，通过以存换算的创新理念大幅度减少算力开销，显著提升了推理吞吐量。

目前Mooncake技术框架已正式开源上线，官方还表示：

欢迎更多企业和研究机构加入Mooncake项目共建，共同探索更加高效和先进的模型推理系统架构创新，让基于大模型技术的AI助手等产品，持续惠及更广泛人群。

金矿上的村庄：遥远的“暴富神话”与“三班倒”矿工丨封面头条

金矿上的村庄：遥远的“暴富神话”与“三班倒”矿工丨封面头条

封面新闻 2024-11-26 14:11:08

终于还是把Mate70发布会看完了，说句实话，不是超越和碾压

终于还是把Mate70发布会看完了，说句实话，不是超越和碾压

陈博世财经 2024-11-27 14:45:09

2025 Moto Morini 31/2海外发布，350cc V型双缸

2025 Moto Morini 31/2海外发布，350cc V型双缸

MOTO 2024-11-28 16:45:00

字节大模型同传智能体，一出手就是媲美人类的同声传译水平

字节大模型同传智能体，一出手就是媲美人类的同声传译水平

机器之心Pro 2024-07-25 14:20:59

《GTA6》PC版确认！还有革命性新技术

《GTA6》PC版确认！还有革命性新技术

游民星空 2024-11-26 11:11:41

两个小模型互相验证，直接比肩大模型？微软的rStar甚至没用CoT

两个小模型互相验证，直接比肩大模型？微软的rStar甚至没用CoT

机器之心Pro 2024-08-16 17:41:46

大众换代“小途观”曝光！换“混动”引擎+8速变速箱，期待吗

大众换代“小途观”曝光！换“混动”引擎+8速变速箱，期待吗

网上车市 2024-11-26 10:17:16

对华加税不到1个月，欧盟先“认输”了？与中方接近达成解决方案

对华加税不到1个月，欧盟先“认输”了？与中方接近达成解决方案

杨门灼见 2024-11-26 10:58:43

重拳出击任天堂正在追查Switch盗版商案的其他成员

重拳出击任天堂正在追查Switch盗版商案的其他成员

3DM游戏 2024-11-28 11:46:06

AI造芯Nature论文遭围攻，谷歌发文硬刚学术抹黑！Jeff Dean怒怼：你们连模型都没训

AI造芯Nature论文遭围攻，谷歌发文硬刚学术抹黑！Jeff Dean怒怼：你们连模型都没训

新智元 2024-11-27 13:39:25

老哥密码忘记了11年的34个比特币，终于找回来了！这其中也是波折

老哥密码忘记了11年的34个比特币，终于找回来了！这其中也是波折

英国那些事儿 2024-10-28 23:18:49

警察的推理能力有多强，仅凭一滩污渍就能查出凶犯

警察的推理能力有多强，仅凭一滩污渍就能查出凶犯

小男孩追剧 2024-11-28 15:04:39

20年前的谜案！恐怖的巨型猎犬！你绝对不能错过！推理

20年前的谜案！恐怖的巨型猎犬！你绝对不能错过！推理

黑猪跑跑 2024-11-27 12:30:26

十问CPU做AI推理，伪命题还是真需求？

十问CPU做AI推理，伪命题还是真需求？

量子位 2024-07-16 17:16:48

木拱桥架构的承重能力有多强

阿木爷爷 2024-11-24 09:28:16

在阿里，痛苦的人开始信教

钛媒体APP 2024-07-26 19:01:14

十二怒汉一部无法逾越的经典之作！推理

十二怒汉一部无法逾越的经典之作！推理

动物有传奇 2024-11-28 07:00:48

超低门槛用AI，你的企业和大模型之间只差这三大法宝

超低门槛用AI，你的企业和大模型之间只差这三大法宝

量子位 2024-09-12 11:32:46

山地硬汉马蒂015：苦等引擎、小友来访

山地硬汉马蒂015：苦等引擎、小友来访

不惑人生事 2024-11-27 17:33:45

吴恩达出手，开源最新Python包，一个接口调用OpenAI等模型

吴恩达出手，开源最新Python包，一个接口调用OpenAI等模型

机器之心Pro 2024-11-26 14:58:37

3元自助早餐，杀疯了

中国新闻周刊 2024-11-27 14:06:45

敞篷车拉上车顶，程序繁琐复杂，众人不买不是没有道理的！

敞篷车拉上车顶，程序繁琐复杂，众人不买不是没有道理的！

一笑倾城趣笑号 2024-11-27 10:47:11

年轻人抛弃搜索引擎

虎嗅APP 2024-10-09 16:10:30

男子在某平台买的车衣，下雪套上后粘在了车上还扣不下来

男子在某平台买的车衣，下雪套上后粘在了车上还扣不下来

重庆聚焦站 2024-11-28 14:09:47

日企出口给我们的中高端数控机床是有锁死程序的

日企出口给我们的中高端数控机床是有锁死程序的

杨大鱼呀 2024-11-27 10:25:22

发布会结束后余承东被人转账6万：有人想订3台尊界！

发布会结束后余承东被人转账6万：有人想订3台尊界！

手机中国 2024-11-26 18:40:05

上海保时捷拒付货拉拉运费其实是这样的，生活已让他满目疮痍了

上海保时捷拒付货拉拉运费其实是这样的，生活已让他满目疮痍了

番茄娱乐加 2024-11-24 12:20:45

字节AI版小李子一开口：黄风岭，八百里

字节AI版小李子一开口：黄风岭，八百里

量子位 2024-09-13 22:49:29

杨妞花说“让她被判得明明白白”余华英案之后还有哪些司法程序？

杨妞花说“让她被判得明明白白”余华英案之后还有哪些司法程序？

张发林 2024-11-26 00:00:00

快刀斩乱麻，特朗普任命的俄乌问题特使，给出的解决方案很直接

快刀斩乱麻，特朗普任命的俄乌问题特使，给出的解决方案很直接

司马平邦 2024-11-28 19:38:46

吴恩达开源大模型套件：11个模型平台一种方式调用，半天获1.2k星

吴恩达开源大模型套件：11个模型平台一种方式调用，半天获1.2k星

量子位 2024-11-26 21:04:56

几行乱码让大模型获得科学思维，这个神奇的提示词突然火了

几行乱码让大模型获得科学思维，这个神奇的提示词突然火了

机器之心Pro 2024-09-04 22:17:21

大神Karpathy：我给大模型「SQL注入」攻击，简直不要太轻松

大神Karpathy：我给大模型「SQL注入」攻击，简直不要太轻松

机器之心Pro 2024-08-16 17:22:16

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自对齐方法 | NIPS 2024

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自对齐方法 | NIPS 2024

新智元 2024-11-28 17:38:49

这是什么样的员工，做出来的年会视频也太有创意了

这是什么样的员工，做出来的年会视频也太有创意了

今晚求教 2024-11-28 02:20:28

8年前阿法狗的一个“错误”，竟成大模型研究新方向！大模型之争进入新阶段，从拼“模仿”转向拼“推理”

8年前阿法狗的一个“错误”，竟成大模型研究新方向！大模型之争进入新阶段，从拼“模仿”转向拼“推理”

量子位 2024-10-19 12:06:26

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

机器之心Pro 2024-06-21 15:20:08

理想汽车直播为何公然逆行，原因是靠不住的视觉语言模型

理想汽车直播为何公然逆行，原因是靠不住的视觉语言模型

燃擎频道 2024-11-26 18:21:06

大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

机器之心Pro 2024-11-19 15:50:17

baby香港出席活动暴瘦仅80斤，忙完凌晨吃火锅被偶遇，素颜好憔悴

baby香港出席活动暴瘦仅80斤，忙完凌晨吃火锅被偶遇，素颜好憔悴

缘浅娱深 2024-11-26 14:29:19