CBA

未开始

新疆

04-29

广州

CBA

未开始

浙江

04-29

上海

CBA

未开始

广东

04-28

广厦

CBA

未开始

辽宁

04-28

深圳

CBA

未开始

上海

04-26

浙江

CBA

未开始

广州

04-26

新疆

CBA

未开始

深圳

04-25

辽宁

CBA

未开始

广厦

04-25

广东

CBA

未开始

广州

04-24

新疆

CBA

未开始

上海

04-24

浙江

CBA

未开始

深圳

04-23

辽宁

CBA

未开始

广厦

04-23

广东

西甲第32轮

未开始

皇马

04-22

巴萨

法甲第30轮

未开始

大巴黎

04-22

里昂

西甲第32轮

未开始

阿拉维斯

04-22

马竞

英超第34轮

未开始

富勒姆

04-21

利物浦

德甲第30轮

未开始

多特蒙德

04-21

勒沃库森

CBA

未开始

新疆

04-21

广州

中超第7轮

未开始

北京国安

04-21

青岛西海岸

CBA

未开始

浙江

04-21

上海

中超第7轮

未开始

梅州客家

04-21

上海海港

NBA

未开始

湖人

04-21

掘金

美职联第9轮

未开始

迈阿密国际

04-21

纳什维尔SC

NBA

未开始

太阳

04-21

森林狼

西甲第32轮

未开始

吉罗纳

04-21

加的斯

英超第34轮

未开始

狼队

04-21

阿森纳

沙特联第28轮

未开始

哈森姆

04-21

吉达联合

NBA

未开始

魔术

04-21

骑士

意甲第33轮

未开始

恩波利

04-21

那不勒斯

中超第7轮

未开始

南通支云

04-20

上海申花

CBA

未开始

辽宁

04-20

深圳

CBA

未开始

广东

04-20

广厦

中超第7轮

未开始

成都蓉城

04-20

深圳新鹏城

中超第7轮

未开始

山东泰山

04-20

沧州雄狮

意甲第33轮

未开始

卡利亚里

04-20

尤文

沙特联第28轮

未开始

利雅得胜利

04-19

费哈

CBA

未开始

新疆

04-19

广州

CBA

未开始

浙江

04-19

上海

欧联1/4决赛

未开始

罗马

04-19

米兰

欧联1/4决赛

未开始

西汉姆联

04-19

勒沃库森

欧联1/4决赛

未开始

马赛

04-19

本菲卡

欧联1/4决赛

未开始

亚特兰大

04-19

利物浦

CBA

未开始

广东

明日

广厦

CBA

未开始

辽宁

明日

深圳

NBA

未开始

老鹰

明日

公牛

NBA

未开始

热火

明日

76人

欧冠1/4决赛

未开始

曼城

明日

皇马

欧冠1/4决赛

未开始

拜仁

明日

阿森纳

NBA

已结束

勇士

94

国王

NBA

已结束

湖人

110

鹈鹕

欧冠1/4决赛

已结束

巴萨

1

大巴黎

欧冠1/4决赛

已结束

多特蒙德

4

马竞

U23亚洲杯第1轮

已结束

韩国U23

1

阿联酋U23

U23亚洲杯第1轮

已结束

日本U23

1

中国U23

CBA

已结束

上海

118

北京

英超第33轮

已结束

切尔西

6

埃弗顿

CBA

已结束

深圳

117

北控

CBA

已结束

广厦

109

山西

NBA

已结束

火箭

116

快船

NBA

已结束

掘金

126

灰熊

NBA

已结束

独行侠

86

雷霆

NBA

已结束

湖人

124

鹈鹕

NBA

已结束

爵士

116

勇士

NBA

已结束

活塞

95

马刺

NBA

已结束

太阳

125

森林狼

NBA

已结束

开拓者

82

国王

意甲第32轮

已结束

国米

2

卡利亚里

NBA

已结束

老鹰

115

步行者

NBA

已结束

公牛

119

尼克斯

NBA

已结束

奇才

122

凯尔特人

NBA

已结束

猛龙

103

热火

NBA

已结束

雄鹿

88

魔术

NBA

已结束

黄蜂

120

骑士

NBA

已结束

篮网

86

76人

意甲第32轮

腰斩

乌迪内斯

1

罗马

CBA

已结束

广州

92

青岛

CBA

已结束

北京

116

上海

CBA

已结束

山西

132

广厦

CBA

已结束

北控

99

深圳

CBA

已结束

青岛

96

广州

CBA

已结束

上海

110

北京

CBA

已结束

深圳

106

北控

CBA

已结束

广厦

107

山西

CBA

已结束

上海

95

浙江

CBA

已结束

广州

109

南京

CBA

已结束

山西

117

北控

CBA

已结束

山东

128

宁波

CBA

已结束

深圳

102

北京

CBA

已结束

新疆

121

江苏

CBA

已结束

吉林

107

福建

CBA

已结束

青岛

87

四川

CBA

已结束

天津

113

广东

CBA

已结束

辽宁

101

广厦

阿里推出AI数据科学家，全流程自动化，科研小白也能用

2024-08-07 14:04:07

基于开源Agent框架，可自动解决复杂数据科学问题的Agent来了！

具体来说，Data Science Assistant（以下称DS Assistant）是基于Modelscope-Agent框架开发的数据科学助手。

有了它，我们只需给需求，这个助手就能自己跑完探索性数据分析（EDA）、数据预处理、特征工程、模型训练，模型评估等步骤。

当然，除了本文将重点提到的DS Assistant，它背后的Modelscope-Agent框架也值得说道。

这个框架由阿里开源，主要特点包括：

可通过vllm、ollama等工具接入各主流开源模型，也可以直接调用模型API；
提供RAG组件支持开发者快速接入知识库；
工具生态丰富，支持大量的Modelscope社区模型作为工具，也支持直接调用langchain的工具，还接入了各类常用的工具，如web-browsing、文生图、code-interpreter等；

更妙的是，Modelscope-Agent框架允许开发者无需编码即可交互式地创建Agent助理。

这不，啪的一下，咱们的数据科学助手“诞生”了~

复杂数据科学任务自动化

实现复杂数据科学任务自动化一直存在挑战。

传统的ReAct（Reasoning and Action）框架对于简单的任务比较有效，但是有以下缺点：

每次工具调用都需要一个LLM调用。
LLM一次仅计划1个子问题。这可能会导致任务的轨迹更加不可控，因为它不会被迫“推理”整个任务。

而DS Assistant使用了plan-and-excute框架，这是一种新兴的Agent框架，通过明确计划和执行步骤高效完成复杂任务。

langchain官网对Plan-and-execute Agent的描述：https://blog.langchain.dev/planning-agents/

具体而言，其工作流程包括以下几个步骤：

1、任务计划：Agent接收用户输入的任务描述，进行语义理解，将任务分解为多个可执行子任务。

2、子任务调度：基于任务之间的依赖关系和优先级，智能调度子任务的执行顺序。

3、任务执行：每个子任务分配给特定的模块执行。

4、结果整合：汇总各子任务的结果，形成最终输出，并反馈给用户。

基于上述框架，咱们接着看整个系统架构，DS Assistant整套系统有4个主要模块。

先说右侧的DS Assistant，它作为整个系统的大脑，负责调度整个系统的运转。

而Plan模块负责根据用户的需求生成一系列Task列表，并对Task先后顺序进行拓扑排序。

在这一阶段，DS Assistant根据用户输入的复杂数据科学问题，自动将其分解为多个子任务。

这些子任务根据依赖关系和优先级被组织和调度，确保执行顺序符合逻辑且高效。

接下来到了Execution模块，负责任务的具体执行，保存任务执行结果。

在这里，每个子任务被具体化为可执行的操作，如数据预处理、模型训练等。

最后是Memory management模块，负责记录任务中间执行结果，代码，数据详情等信息。

在所有Task执行完成后，DS Assistant会将中间数据的执行情况 ( 包括每个task生成的代码和结果，消耗token数，任务时间 ) 保存为文件。

案例实战

下面，我们以一个具体的例子来了解DS Assistant的执行过程。

我们选用Kaggle上的一个比赛任务ICR - Identifying Age-Related Conditions作为示例：

该任务是一项机器学习任务，主要目的是通过分析各种数据（如医疗记录、基因数据、生活方式数据等），识别与年龄相关的健康状况。

最终结果将用来帮助医疗专业人员及早发现老年人群中常见的健康问题，并提供个性化的预防和治疗方案。

废话不多说，我们这就开始~

首先，对于选用的LLM，我们需要配置一下。

我们引入MetaGPT的Data Science工具和Tool Recommender，可以根据任务类型向DS Assistant推荐合适的数据科学工具。

接着，我们需要将任务的具体要求传给DS Assistant。需要注意的是，在要求中需向DS Assistant指明数据文件的路径：

在Plan阶段，DS Assistant会根据用户需求生成任务列表，将整个数据处理流程进行分解，接着对任务列表进行按顺序处理。

可以看到，DS Assistant生成了5个任务，分别是数据探索，数据预处理，特征工程，模型训练和预测。

然后这5个任务进入了Execute阶段，下面咱们挨个看一下。

Task 1: 数据探索

可以看到生成的代码在执行时报了如下错误，原因是没有引入numpy包。

DS Assistant根据报错进行了反思，并重新生成代码并执行，成功输出数据探索的结果。

最后，code judge会对代码进行质检，确保本次生成代码逻辑正确。

Task 2: 数据预处理

在数据预处理阶段，DS Assistant分别对数值型数据和类别型数据进行了合适的缺失值处理，并清除了ID列。

Task 3：特征工程

在修复了两次错误后，DS Assistant对数据进行了特征工程的处理，对类别型变量进行编码。

同时对之前定义的categorical_columns变量进行了更新，去除了ID列。

Task 4：模型训练

DS Assistant主动安装了合适的依赖，并选择了多个模型（随机森林，梯度提升，逻辑回归）进行训练，并选择了结果最好的模型。

Task 5：模型验证

DS Assistant选择了训练集中F1分数最高的模型对验证集进行测试，并计算了这个模型在验证集上的F1分数，成功地完成了任务。

执行完以上任务后，DS Assistant支持将运行结果保存为Jupyter Notebook类型的文件，并记录运行的中间过程。

△Jupyter Notebok

△中间过程记录JSON文件

实验效果

我们使用ML-Benchmark作为测试集（指路论文“Data Interpreter: An LLM Agent For Data Science”），分别从Normalized Performance Score (NPS) ，total time，total token三个维度对DS Assistant效果进行评测。

其中NPS是一种将不同任务或模型的性能指标标准化的方法，使得不同指标之间可以进行比较。

它的计算通常涉及以下步骤：

步骤1：确定指标优化方向，判断性能指标是“越大越好”还是“越小越好”。

步骤2：规范化计算。如果指标是“越大越好”（如准确率、F1分数、AUC），NPS等于原始值；如果指标是“越小越好”（如损失值），则需要将原始值映射到接近1的较高NPS值。

规范化后的性能得分范围通常是0到1，其中1表示最优性能，0表示最差性能。

实验任务详情和结果如下(绿色代表当前任务下最优指标 )：

可以看到，在部分复杂的数据科学任务上，DS Assistant在规范化性能得分(NPS)，任务时间，消耗token数的指标上取得超过开源SOTA的效果。（其中开源SOTA效果指MetaGPT实测值）

完整实验日志：https://modelscope-agent.oss-cn-hangzhou.aliyuncs.com/resources/DS_Assistant_results.zip

总结

对不同的人来说，DS assistant有不同作用：

不熟悉数据分析流程但是又有需要的同学，可以快速根据生成的任务以及处理过程，了解处理数据的思路，以及技术点。
对于了解数据分析流程的同学，可以通过详细的描述，来影响数据处理的方法，方便做不同的实验参照比较。
对于所有人，可以自动化的快速实现对于当前手上文件的更深层次的理解，仅需提问即可。

下一步，DS assistant将从三个方向展开优化：

1、进一步提高任务执行成功率：

a）对于Code Agent来说，传入信息量过大（报错信息，中间数据信息，已生成代码信息）会导致模型生成代码正确率下降，可以在未来考虑使用LLM进行总结，对信息进行筛选。

b）同一个Task可进行进一步的分解，以降低对LLM推理能力的要求。

2、对话交互式，可以将任务和任务的执行展示分开，通过对话的方式推进任务，并影响执行结果。

3、支持批处理相同任务多批文件的场景。

更多细节可进一步查看Modelscope-Agent官方仓库中Data Sciecne Assistant示例。

所有APP都会被AI重塑，背后的变革关键是什么？

所有APP都会被AI重塑，背后的变革关键是什么？

量子位 2024-12-17 12:26:22

BetterYeah AI张毅：企业生产级Agent的落地实践经验

BetterYeah AI张毅：企业生产级Agent的落地实践经验

量子位 2024-12-16 19:05:02

Search版o1：推理过程会主动查资料，整体性能优于人类专家

Search版o1：推理过程会主动查资料，整体性能优于人类专家

量子位 2025-01-18 12:36:46

程序员的AI救赎时刻接入这个数据库业务提问自动解决

程序员的AI救赎时刻接入这个数据库业务提问自动解决

量子位 2024-12-20 18:25:44

爆火开源工具Browser Use，能让AI操作浏览器找工作

爆火开源工具Browser Use，能让AI操作浏览器找工作

量子位 2025-01-13 09:50:42

AI竟会表里不一：人前一套，背后一套！

AI竟会表里不一：人前一套，背后一套！

量子位 2024-12-31 10:12:13

Ilya播客干货引热议：LLM不仅是统计学

Ilya播客干货引热议：LLM不仅是统计学

量子位 2024-12-24 11:34:18

吴恩达预言成真？AI运维专家横扫职场，精准解决80%运维难题

吴恩达预言成真？AI运维专家横扫职场，精准解决80%运维难题

量子位 2025-01-10 16:51:31

真实数据的还原与多模态融合是To Real面临的很大挑战

真实数据的还原与多模态融合是To Real面临的很大挑战

量子位 2024-12-26 15:27:49

为什么AI可以下围棋、打Dota，却连简单的家务都做不好？

为什么AI可以下围棋、打Dota，却连简单的家务都做不好？

量子位 2024-12-17 18:39:55

商汤科技董事长兼CEO 徐立打脸时刻就是AI的超级时刻

商汤科技董事长兼CEO 徐立打脸时刻就是AI的超级时刻

量子位 2024-12-23 14:58:54

AI时代正在形成新的开发范式

量子位 2024-12-18 10:45:54

AI将对传统能源行业带来怎样的变革？

AI将对传统能源行业带来怎样的变革？

量子位 2024-12-17 14:03:00

To Real面临的挑战：云深处科技李超分享观点

To Real面临的挑战：云深处科技李超分享观点

量子位 2024-12-26 15:37:13

AI暴打验证码，人类遭殃？未来，验证码会消失，还是变得更反人类？

AI暴打验证码，人类遭殃？未来，验证码会消失，还是变得更反人类？

量子位 2025-01-02 17:58:49

数据整合与应用是具身智能走向产业的关键

数据整合与应用是具身智能走向产业的关键

量子位 2024-12-26 14:38:20

AI时代下基础设施每个环节将发生怎样的变化？

AI时代下基础设施每个环节将发生怎样的变化？

量子位 2024-12-18 11:08:29

AI暴打验证码，人类遭殃？

量子位 2025-01-02 17:12:56

AI指挥机器人拍照，1:1复刻大片构图

AI指挥机器人拍照，1:1复刻大片构图

量子位 2024-12-18 18:21:56

给AI agent保驾护航、让大模型聊天管住嘴，英伟达造了个安全利器

给AI agent保驾护航、让大模型聊天管住嘴，英伟达造了个安全利器

智东西 2025-01-17 19:58:21

突发！TikTok美国被禁前遭遇收购，“AI界谷歌”Perplexity为何要花3600亿买它？｜钛媒体AGI

突发！TikTok美国被禁前遭遇收购，“AI界谷歌”Perplexity为何要花3600亿买它？｜钛媒体AGI

钛媒体APP 2025-01-19 11:08:49

甲骨文2025开年抖新料，原生AI架构落地小米，称ISV不重构将淘汰

甲骨文2025开年抖新料，原生AI架构落地小米，称ISV不重构将淘汰

智东西 2025-01-19 08:31:59

吴泳铭掌舵阿里这一年

财经天下WEEKLY 2025-01-11 13:21:06

再次出手，74岁的他，接了阿里的盘！

再次出手，74岁的他，接了阿里的盘！

华商韬略 2025-01-14 10:28:48

大神Karpathy：我给大模型「SQL注入」攻击，简直不要太轻松

大神Karpathy：我给大模型「SQL注入」攻击，简直不要太轻松

机器之心Pro 2024-08-16 17:22:16

详细列举大数据专业主要学什么？

详细列举大数据专业主要学什么？

抽烟不喝酒饮茶不读书 2025-01-19 05:25:46

工人使用电机设备，将螺杆转进零件里，网友：干这活不能带手套

工人使用电机设备，将螺杆转进零件里，网友：干这活不能带手套

南阳日报 2025-01-18 18:41:45

世界上最牛女骗子，一滴血骗了600亿，马云都差点入局

世界上最牛女骗子，一滴血骗了600亿，马云都差点入局

欢乐笑料大宝藏 2025-01-19 10:03:11

介文汲：美禁令近在眼前，1.7亿美国用户向抖音告别

介文汲：美禁令近在眼前，1.7亿美国用户向抖音告别

龙悦军急送 2025-01-17 12:36:26

老拜登玩脱了，得罪了1.7亿用户，估计民主党大佬们要恨死拜登！

老拜登玩脱了，得罪了1.7亿用户，估计民主党大佬们要恨死拜登！

周周解说 2025-01-18 11:11:32

AI To C，阿里亮出明牌

钛媒体APP 2025-01-17 10:24:25

AI如何改变社交娱乐新姿势？阿里云AI专家解读来了

AI如何改变社交娱乐新姿势？阿里云AI专家解读来了

量子位 2024-11-27 23:24:00

2025，Agent生死竞速

钛媒体APP 2025-01-08 19:18:23

不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用

不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用

机器之心Pro 2024-11-06 16:33:15

Cursor营收破亿美元，成为百万程序员的默认编辑器

Cursor营收破亿美元，成为百万程序员的默认编辑器

量子位 2025-01-17 11:52:25

AI智能体，人工智能的“增程模式”？

AI智能体，人工智能的“增程模式”？

钛媒体APP 2024-10-28 16:33:28

国产大模型DeepSeek V3一夜之间刷屏，训练成本仅需280万GPU小时

国产大模型DeepSeek V3一夜之间刷屏，训练成本仅需280万GPU小时

量子位 2024-12-27 15:54:35

12名工程师，估值190亿，AI黑马的梦幻故事

12名工程师，估值190亿，AI黑马的梦幻故事

智东西 2025-01-14 20:23:26

学件基座系统可成长、可重组，拓展大模型更多可能性

学件基座系统可成长、可重组，拓展大模型更多可能性

量子位 2025-01-02 11:25:40

国产机器人深圳街头散步爆火！超自然步态吓呆国外网友

国产机器人深圳街头散步爆火！超自然步态吓呆国外网友

量子位 2025-01-10 16:29:56