从OpenAI排拒中国用户,到Deepseek的绝地反攻

DeepSeek(深度求索)在2025年除夕(1月28日)再发布开源文字生成图像(文生图)大模型Janus-Pro 7B。

中国深度求索除夕发布文生图大模型 表现优于OpenAI
联合早报
中国初创企业深度求索公布低成本大模型后,除夕当天(1月28日)再发布开源文字生成图像(文生图)大模型Janus-Pro 7B,该模型在基准测试中超越美国巨头OpenAI。
综合路透社报道和GitHub消息,这款开源多模态模型被设计为高效且多功能的模型,擅长生成逼真图像、执行复杂视觉推理等多种视觉任务。
来自杭州的初创企业深度求索称,Janus-Pro在使用文本提示生成图像的基准测试中,表现优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion。
深度求索说,这款大模型是2024年11月13日发布的JanusFlow大模型的进阶版本。新模型通过改进训练流程、数据质量和模型规模,提升图像生成的稳定性和细节表现。

How to Access DeepSeek Janus Pro 7B?
29 Jan, 2025
With the release of DeepSeek V3 and R1, U.S. tech giants are struggling to regain their competitive edge. Now, DeepSeek has introduced Janus Pro, a state-of-the-art multimodal AI that further solidifies its dominance in both understanding and generative AI tasks. Janus Pro outperforms many leading models in multimodal reasoning, text-to-image generation, and instruction-following benchmarks.
Janus Pro, builds upon its predecessor, Janus, by introducing optimized training strategies, expanding its dataset, and scaling its model architecture. These enhancements enable Janus Pro to achieve notable improvements in multimodal understanding and text-to-image instruction-following capabilities, setting a new benchmark in the field of AI. In this article, we will dissect the research paper to help you understand what’s inside DeepSeek Janus Pro and how you can access DeepSeek Janus Pro 7B.
(略)
The DeepSeek Janus Pro 7B is an AI model designed to handle tasks across multiple formats, like text, images, and videos, all in one system. What makes it stand out is its unique design: it separates the processing of visual information into different pathways while using a single transformer framework to bring everything together. This smart setup makes the model more flexible and efficient, whether it’s analyzing content or generating new ideas. Compared to older multimodal AI models, Janus Pro 7B takes a big step forward in both performance and versatility.

1 个赞

Anthropic CEO says blocking AI chips to China is of existential importance after DeepSeeks release in new blog post.

(链接) (讨论1) (讨论2)

省流不看版:

Anthropic 的首席执行官要求美国政府在 AI 芯片方面加强对中国的出口管控,Anthropic 是 Claude Sonnet 3.5 背后的公司。

DeepSeek 的深度思考太不可思议了:

下面链接对比了文心一言、通义千问、ChatGPT的结果,评论里有 o3-mini-high

https://www.zhihu.com/question/10763834313/answer/89473577848

1 个赞

ds很厉害,试用了一段时间,感觉这个AI比文心一言还要强一些。

1 个赞

1、国内法规要求实名使用大模型?

2、“啰里啰嗦”部分为思考过程,或者说思维链,是 ChatGPT o1 或 DeepSeek R1 的特色。

3、用 “is 9997 a prime number, why?” 问 ChatGPT o1,回答跟深度求索如出一辙。不排除它们训练的“题库”里都有这题。知乎答主只对比 ChatGPT,我觉得不公允,是在田忌赛马。

4、语言模型解数学题好像有瞎蒙的成分,看看过程找思路还行,结果对错就别较真了。

2 个赞

我就用3.5查查信息,翻译翻译,好处是不需要登录,而且没有使用次数限制。查信息需要多角度求证,因为不知道什么时候TA会一本正经的胡说八道。非文学翻译3.5也足够了,支持多段落长文本,支持图片文本,翻译的准确度不错,甚至中文表达也已经相当地道,比一众正式出版物强不少。
没用过什么高级的AI,个人认为AI最重要的不是模型,而是数据。而鉴于人类社会的人文科学中99%以上的断言都是胡说八道,AI也就在自然科学相关领域在提高效率方面有所作为。




还有什么NFT,加密货币(我只字未提,但AI自己吐出一堆广告)参杂在我与其另一对话(官网)中,我都不知道各个模型7b,14b
等是怎么蒸馏的。数理方面没做太深测试和使用,我有一次用它识别rudin数学分析的关于域的定义,纠错,中文入,英文出,正确。

还好没有出现什么“根据相关法律,内容不予显示”之类。

这个世界存在机械论因果观和目的论因果观,马老师的理论认为只有机械论因果观,所以TA的理论中,人是手段,是工具。

准确的说是答非所问,注意我的问题是“9997是质数吗?,而不是”9997是质数吗?为什么?“,最终结果就是不但浪费时间,还可能得不到想要的结果。

所以说啊,AI就是机械论因果观的产物,在人的世界(目的论因果观的世界),AI就是人工智障。”审判日“从逻辑上来说,只能存在科幻片中。

但影响效果。因为TA猜不出我的"目的”,也不会有策略通过我的提问猜测我的目的。

我都写了是深度思考。。你可以了解下再回复我,不想了解就不用回复我了。

1 个赞

我想表达的意思正是深度思考并不是什么值得炫耀的东西,AI不会思考,只是加工数据,从目的论的角度来说,回答并不合格。既然你听不得不同意见,那我就删除回复,不抬杠,各自安好。

o1 需要开会员我没测试,但看了别人截图 o1 的思考过程,确实一模一样的,我觉得深度思考最有价值的地方就是这个思考过程很符合人类的思维方式,只给一位老师纸和笔怎么教学生确定一个数是不是质数。(直接给出 13 这个数的都不算合格的老师。

这个有时候真的难说,如果用语言来表示思考过程是,某一思路突然卡死了,或是太过发散,一条思路不行换另一条,甚至输出多个解决思路(目前我接触都只有一个思路回答,可能性隐去不少)。

有时候人不一定读过,学过其他知识,就有初步的,非学术定义的认知,只不过没很难知道大家已经知道的定义来交流,每次交流时不得不细说自己怎么想的,而非单一确定的词汇(如哲学僵尸,感质对调,运算封闭性),因为注意力有限,短期记忆等容易限制进一步思考,交流,而AI却调用各种名词自如。

而LLM永远缺乏高质量的数据库,这个缺点是因为人的输出本身有些缺陷:

重复,在语文上称为排比,学生作文出现反复论证

缺乏实际经验的异想天开的内容太多,AI没有实际躯体,来与现实交互调整这些想法(但通过结果测试能调整一些能力,deepseek理工,代码解题还行。)

语文上的能力欠缺,由于审查,对文科,读书的普遍存在的轻蔑和网络狂欢的烂梗,出现大量“语言退化”的资料污染LLM,我与deepseek聊天,不知道怎么的,deepseek动不动就推荐加密货币,让deepseek骂人却很地道

错误资料影响(如内容农场不断复制粘贴音乐和弦的错误资料,而中文中免费,正确的音乐资讯较少),deepseek人文学科上准确度很低

关于道德水平,deepseek算是目前最低的了,写黄书还算轻的了,还能输出洗钱,传销,网络攻击等内容

DeepSeek:“中国创新、美国模仿”
参考消息网,2025-02-02
(略)
以DeepSeek为代表的中国企业的出现,打破了许多对中国创新的陈腐偏见。这无疑推翻了过去“美国创新、中国模仿、欧洲监管”的观点。虽然DeepSeek不是在车库里成立的,但它在很多方面都像是白手起家的硅谷初创企业。该公司成立于2023年,与美国开放人工智能研究中心(OpenAI)和“深层思维”公司有着同样的雄心壮志,即实现人类水平的人工智能,或者通用人工智能(AGI)。
DeepSeek通过其专注的方法,开发出一款性能强大的推理模型,它无需依靠巨大的算力,而且成本似乎只是美国竞争对手的一小部分。美国政界人士迅速提出对DeepSeek的“安全和隐私”担忧,和对待其他中国应用程序的做法如出一辙。OpenAI甚至指责这家中国公司可能存在“侵犯知识产权”行为。然而,考虑到OpenAI多次被起诉侵犯版权,这令人感到荒唐。
(略)
http://www.cankaoxiaoxi.com/#/detailsPage/guandian/c3a1b7b9207043d18c426a3c5b184d0e/1/2025-02-01%2009:34?childrenAlias=undefined

奥尔特曼:OpenAI站在了历史错误的一边
参考消息网,2025年2月1日
(略)
奥尔特曼1月31日在社交平台美国红迪网站的一场“随你问”环节中,回应“是否考虑公开OpenAI的研究”时说:“我个人认为,我们站在了历史错误的一边,需要制定不同的开源策略。”
(略)
奥尔特曼在谈到DeepSeek时说:“这是一个非常好的模型。我们会发展出更好的模型,但我们将不如前几年,保持那么大的领先优势。”
(略)
开源指的是公开软件源代码的做法。DeepSeek、美国元宇宙平台公司和法国米斯特拉尔人工智能公司都称,它们的模型是采用开源模式。
http://www.cankaoxiaoxi.com/#/detailsPage/kejiyy/be42dfc6a11046b9ad510703c72a8e56/1/2025-02-01%2019:40?childrenAlias=undefined

1 个赞

不同的 AI 模型擅长的任务都各不相同,目前混着用就行了。最近三个月,我用的最多的其实是豆包,在各种评测里也就比文心一言强, 但架不住产品实在好用, 而 DeepSeek 之前就没什么用户,根本没考虑过这些。

Deepseek目前的开源版本还是使用英伟达提供的PTX → SASS工具链,如果AI 芯片继续分三六九等出口管控 + OpenAI闭源,而Deepseek推出替代“CUDA代码 → PTX → SASS” 的去NVIDIA的工具链,那英伟达的护城河真的要倒塌一大半了。现在amd7900xtx在Deepseek本地部署上已经超越了4090。

本质上还是AI生态的竞争,所以逼迫OpenAI重新考虑其闭源策略

3 个赞

英伟达的垄断并不是什么好事。

有利于打破英伟达垄断的,不管是不是deepseek,我都支持