CBA

未开始

新疆

04-29

广州

CBA

未开始

浙江

04-29

上海

CBA

未开始

广东

04-28

广厦

CBA

未开始

辽宁

04-28

深圳

CBA

未开始

上海

04-26

浙江

CBA

未开始

广州

04-26

新疆

CBA

未开始

深圳

04-25

辽宁

CBA

未开始

广厦

04-25

广东

CBA

未开始

广州

04-24

新疆

CBA

未开始

上海

04-24

浙江

CBA

未开始

深圳

04-23

辽宁

CBA

未开始

广厦

04-23

广东

西甲第32轮

未开始

皇马

04-22

巴萨

法甲第30轮

未开始

大巴黎

04-22

里昂

西甲第32轮

未开始

阿拉维斯

04-22

马竞

英超第34轮

未开始

富勒姆

04-21

利物浦

德甲第30轮

未开始

多特蒙德

04-21

勒沃库森

CBA

未开始

新疆

04-21

广州

中超第7轮

未开始

北京国安

04-21

青岛西海岸

CBA

未开始

浙江

04-21

上海

中超第7轮

未开始

梅州客家

04-21

上海海港

NBA

未开始

湖人

04-21

掘金

美职联第9轮

未开始

迈阿密国际

04-21

纳什维尔SC

NBA

未开始

太阳

04-21

森林狼

西甲第32轮

未开始

吉罗纳

04-21

加的斯

英超第34轮

未开始

狼队

04-21

阿森纳

沙特联第28轮

未开始

哈森姆

04-21

吉达联合

NBA

未开始

魔术

04-21

骑士

意甲第33轮

未开始

恩波利

04-21

那不勒斯

中超第7轮

未开始

南通支云

04-20

上海申花

CBA

未开始

辽宁

04-20

深圳

CBA

未开始

广东

04-20

广厦

中超第7轮

未开始

成都蓉城

04-20

深圳新鹏城

中超第7轮

未开始

山东泰山

04-20

沧州雄狮

意甲第33轮

未开始

卡利亚里

04-20

尤文

沙特联第28轮

未开始

利雅得胜利

04-19

费哈

CBA

未开始

新疆

04-19

广州

CBA

未开始

浙江

04-19

上海

欧联1/4决赛

未开始

罗马

04-19

米兰

欧联1/4决赛

未开始

西汉姆联

04-19

勒沃库森

欧联1/4决赛

未开始

马赛

04-19

本菲卡

欧联1/4决赛

未开始

亚特兰大

04-19

利物浦

CBA

未开始

广东

明日

广厦

CBA

未开始

辽宁

明日

深圳

NBA

未开始

老鹰

明日

公牛

NBA

未开始

热火

明日

76人

欧冠1/4决赛

未开始

曼城

明日

皇马

欧冠1/4决赛

未开始

拜仁

明日

阿森纳

NBA

已结束

勇士

94

国王

NBA

已结束

湖人

110

鹈鹕

欧冠1/4决赛

已结束

巴萨

1

大巴黎

欧冠1/4决赛

已结束

多特蒙德

4

马竞

U23亚洲杯第1轮

已结束

韩国U23

1

阿联酋U23

U23亚洲杯第1轮

已结束

日本U23

1

中国U23

CBA

已结束

上海

118

北京

英超第33轮

已结束

切尔西

6

埃弗顿

CBA

已结束

深圳

117

北控

CBA

已结束

广厦

109

山西

NBA

已结束

火箭

116

快船

NBA

已结束

掘金

126

灰熊

NBA

已结束

独行侠

86

雷霆

NBA

已结束

湖人

124

鹈鹕

NBA

已结束

爵士

116

勇士

NBA

已结束

活塞

95

马刺

NBA

已结束

太阳

125

森林狼

NBA

已结束

开拓者

82

国王

意甲第32轮

已结束

国米

2

卡利亚里

NBA

已结束

老鹰

115

步行者

NBA

已结束

公牛

119

尼克斯

NBA

已结束

奇才

122

凯尔特人

NBA

已结束

猛龙

103

热火

NBA

已结束

雄鹿

88

魔术

NBA

已结束

黄蜂

120

骑士

NBA

已结束

篮网

86

76人

意甲第32轮

腰斩

乌迪内斯

1

罗马

CBA

已结束

广州

92

青岛

CBA

已结束

北京

116

上海

CBA

已结束

山西

132

广厦

CBA

已结束

北控

99

深圳

CBA

已结束

青岛

96

广州

CBA

已结束

上海

110

北京

CBA

已结束

深圳

106

北控

CBA

已结束

广厦

107

山西

CBA

已结束

上海

95

浙江

CBA

已结束

广州

109

南京

CBA

已结束

山西

117

北控

CBA

已结束

山东

128

宁波

CBA

已结束

深圳

102

北京

CBA

已结束

新疆

121

江苏

CBA

已结束

吉林

107

福建

CBA

已结束

青岛

87

四川

CBA

已结束

天津

113

广东

CBA

已结束

辽宁

101

广厦

本地大模型怎么搭？傻瓜式部署指南来了：跟着我做就对啦

2024-06-13 20:45:07

诶，大伙有没有发现，这两年的科技趋势，和以往几年都不大相同。

AI大模型，成为了科技圈的香饽饽。

用户需求的日益增长，推动了AI技术的进化。随着大语言模型的应用场景日益增多，它们开始在我们的生活中扮演着越来越重要的角色。

尤其是休闲娱乐和实际工作中，大语言模型的应用变得越来越普遍。这些模型以其自然的语义能力、强大的数据处理能力和复杂任务的执行效率，为用户提供了前所未有的便利，甚至是以往人们不敢想象的数字陪伴感。

不过，随着大语言模型的高速普及下，云端大模型的局限性逐渐显现出来。

连接缓慢，成本高昂，还有成为热议话题的数据隐私问题，没有人可以轻易忽视。最重要的是，基于各种制度和伦理道德的云端审核制度，进一步限制了大语言模型的自由。

本地部署，似乎为我们指引了一条新的道路。

随着本地大模型的呼声越来越高，今年Github和Huggingface上涌现出不少相关的项目。在多番研究后，我也顺藤摸瓜，拿到了本地部署大模型的简单方法。

So，本地部署对我们的AI体验来说，到底是锦上添花，还是史诗级增强？

跟着小雷的脚步，一起来盘盘。

本地大模型到底是个啥？

开始前，先说点闲话。

就是咋说呢，可能有些读者还是没懂「本地大模型」的意思，也不知道这有啥意义。

总而言之，言而总之。

现阶段比较火的大模型应用，例如国外的ChatGPT、Midjourney等，还有国内的文心一言、科大讯飞、KIWI这些，基本都是依赖云端服务器实现各种服务的AI应用。

（图源：文心一言）

它们可以实时更新数据，和搜索引擎联动整合，不用占用自家电脑资源，把运算过程和负载全部都放在远端的服务器上，自己只要享受得到的结果就可以了。

换句话说，有网，它确实很牛逼。

可一旦断网，这些依赖云端的AI服务只能在键盘上敲出「GG」。

作为对比，本地大模型，自然是主打在设备本地实现AI智能化。

除了不用担心服务器崩掉带来的问题，还更有利于保护用户的隐私。

毕竟大模型运行在自己的电脑上，那么训练数据就直接存在电脑里，肯定会比上传到云端再让服务器去计算来得安心一点，更省去了各种伦理道德云端审核的部分。

不过，目前想要在自己的电脑上搭建本地大模型其实并不是一件容易的事情。

较高的设备要求是原因之一，毕竟本地大模型需要把整个运算过程和负载全部都放在自家的电脑上，不仅会占用你的电脑机能，更会使其长时间在中高负载下运行。

其次嘛……

从Github/Huggingface上琳琅满目的项目望去，要达成这一目标，基本都需要有编程经验的，最起码你要进行很多运行库安装后，在控制台执行一些命令行和配置才可以。

别笑，这对基数庞大的网友来说可真不容易。

那么有没有什么比较「一键式」的，只要设置运行就可以开始对话的本地应用呢？

还真有，Koboldcpp。

工具用得好，小白也能搞定本地大模型

简单介绍一下，Koboldcpp是一个基于GGML/GGUF模型的推理框架，和llama.cpp的底层相同，均采用了纯C/C++代码，无需任何额外依赖库，甚至可以直接通过CPU来推理运行。

（图源：PygmalionAI Wiki）

当然，那样的运行速度会非常缓慢就是了。

要使用Koboldcpp，需要前往Github下载自己所需的应用版本。

当然，我也会把相对应的度盘链接放出来，方便各位自取。

目前Koboldcpp有三个版本。

koboldcpp_cuda12：目前最理想的版本，只要有张GTX 750以上的显卡就可以用，模型推理速度最快。

koboldcpp_rocm：适用于AMD显卡的版本，基于AMD ROCm开放式软件栈，同规格下推理耗时约为N卡版本的3倍-5倍。

koboldcpp_nocuda：仅用CPU进行推理的版本，功能十分精简，即便如此同规格下推理耗时仍为N卡版本的10倍以上。

（图源：Github）

打开软件后，首先可以关注一下Presets选项。

软件首页的Presets里，分为旧版N卡、新版N卡、A卡、英特尔显卡等多种不同模式的选择。

默认情况下，不设置任何参数启动将仅使用CPU的OpenBLAS进行快速处理和推理，运行速度肯定是很慢的。

作为N卡用户，我选用CuBLAS，该功能仅适用于Nvidia GPU，可以看到我的笔记本显卡已经被识别了出来。

（图源：雷科技）

对于没有Intel显卡的用户，可以使用CLblast，这是OPENCL推出的、可用于生产环境的开源计算库，其最大的特征是更强调通用性，至于性能方面本人并没有做过详细测试。

另一个需要在主页调节的部分是Context Size。

想要获得更好的上下文体验，最好将其调整至4096，当然Size越大，能记住的上下文就越多，但是推理的速度也会受到显著影响。

（图源：雷科技）

再往下，就是载入大模型的部分。

目前开源大模型主要都在huggingface.co下载，没有出海能力的话，也可以在国内HF-Mirror镜像站或是modelscope魔搭社区下载。

结合个人实际体验，我推荐两款不错的本地大模型：

CausalLM-7B

这是一款在LLaMA2的基础上，基于Qwen 的模型权重训练的本地大模型，其最大的特征就是原生支持中文，显卡内存8G以下的用户建议下载CausalLM-7B，8G以上的可以下载CausalLM-14B，效果更好。

（图源：modelscope）

MythoMax-L2-13B

原生语言为英语的大模型，特征是拥有较强的文学性，可以在要求下撰写出流畅且具有阅读性的小说文本，缺点是只能通过输入英语来获得理想的输出内容，建议普通消费者使用MythoMax-L2-13B。

如果只是想使用大语言模型的话，其他部分不需要做调整，直接点击启动，你选择的模型就可以在本地加载好了。

一般来说，接下来你还得给大模型部署前端才能使用。

不过Koboldcpp最大的特点，就是在llama.cpp的基础上，添加了一个多功能的Kobold API端口。

这个端口，不仅提供了额外的格式支持、稳定的扩散图像生成、不错的向后兼容性，甚至还有一个具有持久故事、编辑工具、保存格式、内存、世界信息、作者注释、人物、场景自定义功能的简化前端——Kobold Lite。

大致上，界面就像这样。

（图源：雷科技）

功能也很简单。

人工智能、新会话就不用说了，点击上方的「场景」，就可以快速启动一个新的对话场景，或是加载对应角色卡。

（图源：雷科技）

像这样，加载你拥有的AI对话情景。

「保存/加载」也很一目了然，可以把你当前的对话保存下来，随时都能加载并继续。

在「设置」中，你可以调节一些AI对话的选项。

（图源：雷科技）

其中，Temperature.代表着对话的随机性，数值越高，生成的对话也就会越不可控，甚至可能超出角色设定的范围。

Repetition Penalty.可以抑制对话的重复性，让AI减少重复的发言。

Amount to Gen.是生成的对话长度上限，上限越长，所需时间也会更长，重点是在实际体验中，过高的生成上限会导致AI胡言乱语，个人并不建议把这个值拉到240以上。

Max Ctx. Tokens.是能给大模型反馈的关键词上限，数据越高，前后文关系越紧密，生成速度也会随之变慢。

完成设置后，就可以和todd howard来场酣畅淋漓的对话了。

（图源：雷科技）

聊不下去了？

点击左下角的聊天工具，可以让大模型根据你的前文自动生成答复来推进对话。

（图源：雷科技）

回答错了，或是对话走向不如人意？

点击右下角的聊天工具，不仅可以让你重复生成AI问答，甚至还能自己出手编辑回复以确保对话走向不跑偏。

当然，除了对话以外，Kobold Lite还有更多可能性。

你可以将它和AI语音、AI绘图的端口连接在一起，这样在对话的同时，可以自动调用AI语言为生成的文本进行配音，也可以随时调用AI绘图来画出当前二人交谈的场景。

在此之上，你甚至可以使用更高阶的SillyTarven前端，来实现GIF、HTML内容在对话中的植入。

当然这些，都是后话了。

总结

好，部署本地大模型的教程就到这了。

文章里面提到的软件和大模型，我都已经传到百度网盘里了，感兴趣的读者可以自取。

就我这大半年的体验来看，目前本地大模型的特征还是「可玩性强」。

只要你的配置足够，你完全可以把大语言模型、AI语音、AI绘图和2D数字人连接在一起，搭建起属于自己的本地数字人，看着在屏幕中栩栩如生的AI角色，多少让人有种《serial experiments lain》那样的恍惚感。

不过这类开源大模型，通常数据都会比较滞后，因此在专业性知识上会有比较明显的欠缺，实测大部分知识库都是到2022年中旬为止，也没有任何调用外部网络资源的办法，辅助办公、查阅资料时会遇到很大的局限性。

在我看来，理想的大语言模型体验应该是端云互动的。

即我可以在本地，利用自己的大模型建立自己的知识库，但是需要用到时效性信息的时候，又能借助互联网的力量获取最新资讯，这样既可以保护个人资料的隐私性，也算是有效解决了开源大模型信息滞后的问题。

至于本地角色交流这块，如果大家感兴趣的话……

要不，我把雷科技的角色卡给整出来？

2024年5月20日-6月30日，618年中大促来袭，淘宝天猫、京东、拼多多、抖音、快手、小红书六大电商平台集体“听劝”，取消预售、疯狂杀价！
手机数码、AI PC、智能家电、电视、小家电、空冰洗等热门AI硬科技品类摩拳擦掌，战况激烈。
雷科技618报道团将全程关注电商平台最新战况，AI硬科技品牌最新动态，电商行业全新趋势，敬请关注，一起期待。

两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

量子位 2024-08-11 12:58:22

大疆前高管带6人创业，做出了类目Top1的割草机器人

大疆前高管带6人创业，做出了类目Top1的割草机器人

钛媒体APP 2024-05-30 14:49:18

全世界跑得最快的人形机器人，还能跳科目三都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有

全世界跑得最快的人形机器人，还能跳科目三都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有

爱范儿 2024-07-04 20:41:36

不会写代码全交给AI，它能写出完整的APP吗？这是我们的测试结果

不会写代码全交给AI，它能写出完整的APP吗？这是我们的测试结果

量子位 2024-09-04 13:29:57

网友用350美元造出能走能玩的端到端人形机器人

网友用350美元造出能走能玩的端到端人形机器人

量子位 2024-11-15 17:47:23

网友一个定积分的WIFI密码，测出了AI数学之王。Grok超强数学思维碾压ChatGPT，引马斯克点

网友一个定积分的WIFI密码，测出了AI数学之王。Grok超强数学思维碾压ChatGPT，引马斯克点

量子位 2024-10-31 18:55:41

告别屈膝小碎步让机器人像人一样走路国产团队造出“钢铁侠”

告别屈膝小碎步让机器人像人一样走路国产团队造出“钢铁侠”

量子位 2024-10-24 11:42:12

全球最远1.4米！国产宇树创人形机器人跳远纪录，外网惊叹碾压特斯拉

全球最远1.4米！国产宇树创人形机器人跳远纪录，外网惊叹碾压特斯拉

量子位 2024-10-19 12:16:06

国产AI视频神器X-Portrait 2，效果碾压Runway

国产AI视频神器X-Portrait 2，效果碾压Runway

量子位 2024-11-14 17:24:46

AI攻克量子计算纠错！DeepMind发布新模型AlphaQubit

AI攻克量子计算纠错！DeepMind发布新模型AlphaQubit

量子位 2024-11-25 17:10:37

AI眼镜是智能硬件的新方向，还是伪概念？

AI眼镜是智能硬件的新方向，还是伪概念？

经济观察报 2024-11-24 14:58:10

人形机器人狂奔！山地、草地、公路无障碍，原速演示全程高能

人形机器人狂奔！山地、草地、公路无障碍，原速演示全程高能

量子位 2024-10-14 13:19:05

机器人身穿衣服做家务被质疑！来自OpenAI押注的独角兽因过于逼真被怀疑是真人套壳——人形机器人初

机器人身穿衣服做家务被质疑！来自OpenAI押注的独角兽因过于逼真被怀疑是真人套壳——人形机器人初

量子位 2024-09-04 18:16:57

大模型可视化工具爆火，GPT推理过程一目了然

大模型可视化工具爆火，GPT推理过程一目了然

量子位 2024-11-18 15:41:30

新晋AI编程神器干翻Cursor！首创实时感知无限用，估值12.5亿华人初创震惊AI界

新晋AI编程神器干翻Cursor！首创实时感知无限用，估值12.5亿华人初创震惊AI界

新智元 2024-11-24 12:41:25

AI是怎么认出AI视频的？人类靠寻找“违和感”，AI靠的是

AI是怎么认出AI视频的？人类靠寻找“违和感”，AI靠的是

量子位 2024-11-08 18:51:54

纯血鸿蒙，再造一个操作系统时代

纯血鸿蒙，再造一个操作系统时代

36氪 2024-10-23 19:33:48

机器人独立造车真的可行吗？网友脑洞大开试验，结果来了！

机器人独立造车真的可行吗？网友脑洞大开试验，结果来了！

量子位 2024-09-03 10:49:25

最有打工天赋的机器人出现了！一镜到底的连续大负载搬运，动态超稳，来自国产的逐际动力

最有打工天赋的机器人出现了！一镜到底的连续大负载搬运，动态超稳，来自国产的逐际动力

量子位 2024-08-12 10:39:39

8年前阿法狗的一个“错误”，竟成大模型研究新方向！大模型之争进入新阶段，从拼“模仿”转向拼“推理”

8年前阿法狗的一个“错误”，竟成大模型研究新方向！大模型之争进入新阶段，从拼“模仿”转向拼“推理”

量子位 2024-10-19 12:06:26

大学生人工智能创新大赛上参赛选手双手合十跪地磕头

大学生人工智能创新大赛上参赛选手双手合十跪地磕头

比奇看有趣 2024-11-25 12:27:17

几行乱码让大模型获得科学思维，这个神奇的提示词突然火了

几行乱码让大模型获得科学思维，这个神奇的提示词突然火了

机器之心Pro 2024-09-04 22:17:21

市场份额50%！ openEuler系装机量过千万国产操作系统借开源突围

市场份额50%！ openEuler系装机量过千万国产操作系统借开源突围

量子位 2024-11-19 14:35:43

大神Karpathy：我给大模型「SQL注入」攻击，简直不要太轻松

大神Karpathy：我给大模型「SQL注入」攻击，简直不要太轻松

机器之心Pro 2024-08-16 17:22:16

5年千亿估值，清华系大模型的崛起之路

5年千亿估值，清华系大模型的崛起之路

钛媒体APP 2024-08-28 18:59:23

泽连斯基：正详细检查“榛树”导弹残骸寻找应对方法

泽连斯基：正详细检查“榛树”导弹残骸寻找应对方法

央视新闻客户端 2024-11-25 07:25:13

象棋软件比赛巅峰对决堪称神仙打架弃子乱舞

象棋软件比赛巅峰对决堪称神仙打架弃子乱舞

四郎讲棋 2024-11-25 07:01:00

无知者无畏，网络舆论战认知与解析系列，普及基础知识

无知者无畏，网络舆论战认知与解析系列，普及基础知识

承叔记 2024-11-23 16:19:00

网友在村里的小卖部，发现一款低价模型，网友：怎么比外面卖还便宜

网友在村里的小卖部，发现一款低价模型，网友：怎么比外面卖还便宜

就成都 2024-11-23 10:53:41

全球人工智能实力排行榜：阿联酋飙升至第五

全球人工智能实力排行榜：阿联酋飙升至第五

量子位 2024-11-25 12:56:04

1000多个智能体组成，AI社会模拟器MATRIX-Gen助力大模型自我进化

1000多个智能体组成，AI社会模拟器MATRIX-Gen助力大模型自我进化

机器之心Pro 2024-11-14 17:08:05

利用大模型知识库，优化智能客服问答效果 | 创新场景

利用大模型知识库，优化智能客服问答效果 | 创新场景

钛媒体APP 2024-07-04 18:14:16

乌镇最火AI议题，原来答案藏在这份报告里

乌镇最火AI议题，原来答案藏在这份报告里

量子位 2024-11-25 12:52:13

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

量子位 2024-09-08 13:27:35

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

机器之心Pro 2024-06-21 15:20:08

8岁小孩哥上手用AI制作游戏，全程2小时，引来50多万人围观

8岁小孩哥上手用AI制作游戏，全程2小时，引来50多万人围观

机器之心Pro 2024-09-03 14:38:55

肌肉骨骼居然和人类一样。外网爆火的克隆机器人，灵活性超高，胸腔里还复刻了人类的心脏瓣膜，宛如《西部世

肌肉骨骼居然和人类一样。外网爆火的克隆机器人，灵活性超高，胸腔里还复刻了人类的心脏瓣膜，宛如《西部世

量子位 2024-10-26 12:28:00

搭载ChatGPT的《星际穿越》机器人爆火，马斯克：想要！ ChatGPT复刻版《星际穿越》机器人T

搭载ChatGPT的《星际穿越》机器人爆火，马斯克：想要！ ChatGPT复刻版《星际穿越》机器人T

量子位 2024-07-09 12:03:11

国内开店卷不动，换上AI出海试试

国内开店卷不动，换上AI出海试试

量子位 2024-07-17 16:09:25

大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

机器之心Pro 2024-11-19 15:50:17