从OpenAI排拒中国用户,到Deepseek的绝地反攻

deepseek r1 英翻中prompt 4 步:

  1. 仔细阅读原文
  2. 检查翻译后的整体文本,是否连贯,是否有专业术语要调整
  3. 检查句子的衔接,改到流畅为止
  4. 通读全文,改成符合中文阅读习惯

想请问一下,您推荐电脑版,还是直接用网页版即可?我有试用过手机版,是可以听到她讲话,甚至可以直接语音对话,但网页版好像没有发音的功能?

(更新:登录后就看到朗读功能了)

豆包一定要装电脑的客户端,网页、手机端和其他几家区分不出特色来。

下载链接:

详细介绍:(链接)

在大多数 AI 应用都还停留在 ChatBot 网页,依靠一问一答来做交互的时候,豆包电脑版优化了很多场景的触达方式 —— 快捷键唤起、划词搜索、网页上 AI 总结的按键、针对视频和播客的专门优化、跨 PC 应用在其他文本编辑器中直接使用,等等等等。

在这样的交互设计下,可以省去很多对话和复制粘贴,让用户真正一键 AI,处处 AI,这才是从用户出发的产品设计。

1 Like

美国将会更严格地管制GPU出口,DeepSeek适配中国国产GPU,是合理的下一步。

DeepSeek据报绕开英伟达编程框架,适配中国国产GPU
联合早报,
(略)

据美国科技网站“Tom’s Hardware”1月29日报道,韩国未来资产证券在分析DeepSeek技术论文时发现,DeepSeek在花两个月训练所研发的语言大模型时,只用了英伟达2048个含H800晶片的图形处理器(GPU),硬件效能比AI领域佼佼者Meta高出10倍。
分析指出,DeepSeek这项突破通过使用英伟达为GPU设计的中间指令集框架(Parallel Thread Execution,简称PTX),而不是英伟达开发的软硬体统一计算架构(Compute Unified Device Architecture,简称CUDA)。
CUDA是一种通用编程框架,允许开发者利用英伟达的GPU进行通用计算。
据网易新闻和快科技报道,大模型开发商在使用英伟达GPU,一般是基于CUDA做研发。使用CUDA对开发者的要求较低,因为CUDA里已经封装好一些函数,使用时完全无需理会太多细节,但肯定会损失执行效率。
由于CUDA是通用型编程框架,因此会导致训练模型时损失一些灵活性。 DeepSeek的做法是直接使用PTX,以绕开硬件对训练速度的限制,可缩短训练时长。其他模型训练时长要10天,DeepSeek五天就能完成。
快科技引述消息人士称,DeepSeek拥有一些擅长写PTX语言的内部开发者,倘若DeepSeek未来有意改适配中国国产的GPU,在硬体适配方面将更得心应手。
DeepSeek据报绕开英伟达编程框架 适配中国国产GPU

华为芯片为DeepSeek AI的推理阶段提供了支持
(略)

他表示,DeepSeek R1 LLM(大型语言模型)是在 NVIDIA H100 上进行的训练,但使用了 Ascend 910C 芯片进行推理,即使用训练好的模型生成回复。由于 Ascend 芯片不涉及训练,因此对 GPU 的功耗要求并不高。
不过,Ascend 910C 相对较低的性能限制了它在训练方面的适用性。 华为计划通过即将推出的 920C 芯片来解决这一问题,旨在与 NVIDIA 用于人工智能操作的领先芯片组 Blackwell B200 竞争。
华为芯片为 DeepSeek AI的推理阶段提供了支持 - Huawei 华为 - cnBeta.COM

2 Likes

怎么操作呀,哟看一个英文网页,或者复制英文文本,怎么贴上去翻译啊?

打开deepseek的网页
请按以下步骤把英文重新写为中文
1.仔细阅读原文
2.用中文重新写以下英文文本,并检查整体文本,是否连贯,是否有专业术语要调整
3.检查句子的衔接,改到流畅为止
4.通读全文,改成符合中文阅读习惯

这里是你要翻译的英文

1 Like

报道称,基准测试结果表明,DeepSeek的大模型在推理密集型任务中极具竞争力,在数学和编码等领域始终保持顶级性能,但在非推理任务和事实查询准确性方面,与OpenAI最先进的产品仍有明显差距。

DeepSeek vs ChatGPT - how do they compare?

Javier Aguirre, an AI researcher at Samsung Medical Center in Seoul, South Korea, specialises in researching in medicine and AI.

In a post on LinkedIn on Tuesday, he wrote: "I am quite impressed with Deepseek. While coding, we usually try to explode AI chatbots to the limit to see their capabilities in assisting with coding.

“Today I had a really tricky and complex problem. Even chatGPT o1 was not able to reason enough to solve it. I gave a try to Deepseek and it solved it at once and straight to the point.”

He also pointed out that for coders, the combination of models can lead to success. This was echoed by Addy Osmani, who is the Head of Chrome Developer Experience at Google.

In a post to his 208k followers on LinkedIn, he spoke about combining DeepSeek with US AI firm Anthropic’s tool Claude Sonnet. In 2023, Amazon invested $4bn into Anthropic.

Mr Osmani said: “Code with AI? DeepSeek R1 + Claude Sonnet may be the best new hybrid coding model. Yes, engineers are using them together.”

Mr Osmani also said DeepSeek was “significantly cheaper” to use than both Claude Sonnet and OpenAI’s o1 model.
DeepSeek vs ChatGPT – how do they compare?

1 Like

中国AI高科技井喷?剖析中国大战略
中时新闻网,2025/02/06
罗庆生
(略)

我们注意到包括游戏科学的冯骥、DeepSeek的梁文锋,宇树科技的王兴兴,这些企业创办人都是80后的年轻人,而且不像前一代高科技创业家有美国学术背景,他们都是中国大学自己培养出的人才。“人才是立国之基,教育为立国之本”,这些了无新意的传统论述,今天却显示出独特意义。传统的“立国”概念就是“大战略”,中国的大战略就是重视教育。而在这大战略下,中国的大学教育已经今非昔比。

中国大学科研能力整体已优于美国

一般比较世界大学,喜欢引用《QS世界大学排名》。这个由英国高等教育调查机构Quacquarelli Symonds(QS)主持的评比,去年10月公布了2025年的世界大学排名。美国麻省理工第一、英国伦敦帝国学院第二、牛津第三、哈佛第四、剑桥第五,中国大学排名最高的是北京大学第14名、清华大学第20名。从这份榜单来看,中国大学距离西方著名大学还有段遥远距离。

但QS的计分方式是综合评估。包括学术声誉、雇主评分、师生比、国际学生人数…等等都列入计分项。研究实力,也就是教职员论文平均被引用数,只占比20%,还不如学术声誉的30%。这其实是个印象分数,反映的是之前大学的学术成就,而不是现在或未来。如果只比较各大学当前的研究实力,那么“自然指数”(Nature Index)的排名将更客观些。因为它只针对研究实力,不渗其他水分。

“自然指数”是总部位于伦敦的自然科研(Nature Portfolio)科学期刊出版集团,统计各研究机构或国家,在82种世界顶尖科学期刊上发表的文章篇数后进行排名,因此可以客观比较出各大学当前的研究实力。

也是去年10月,“自然指数”公布了世界各大学从2023年8月到2024年7月的科学论文统计数据。排名第一的是美国哈佛大学,但之后的第2到第9名,全部是中国大学。分别是:中国科学院大学、中国科学技术大学、北京大学、南京大学、浙江大学、清华大学、中山大学、上海交通大学。美国麻省理工只排到第10位。而排名前50的大学中,中国大学占了21个。

学界都知道论文的重要性。教师升等要发表论文,而且最好能登上SCI、SSCI或至少TSCI、TSSCI等级的期刊上。论文能被世界顶尖科学期刊收录要有非常高的水准。作为对比,台湾最好的台大,“自然指数”仅排名第172,清大343、阳明交大344、成大446,其他都在500强排名之外。这份客观的排序显示中国大学的科研实力,不仅已远远超过台湾,整体也已超过美国。

浙江大学尤其令人惊艳,排名还超过夙负盛名的清华大学。DeepSeek的梁文锋、宇树科技的王兴兴,都是浙大毕业。他们的崛起并不是无中生有或天分特别高,而是得到良好的学习与研究环境培养。他们的研发团队,也都是同样受到良好培养的年轻人。

中国大学已培养出一个非常庞大且实力坚强的工程师团体,每年毕业的理工科大学生超过500万人。他们有些会到美国留学,学成后留在美国就业。美国硅谷搞AI研发的亚洲面孔超过一半,开发AI晶片的辉达CEO黄仁勋、AMD的苏姿丰也都是华裔。因而有人戏称,美、中的AI竞赛,其实是在中国的中国人,与在美国的中国人之间的竞争。当然这里的“中国人”指的是华裔的血统概念。

然而这说法只触及表面。美、中AI竞争更深层的意义,是中国大学培养的AI人才,与美国大学培养的AI人才之间的竞争。这才显得DeepSeek的成功多么具有深意,他们研发团队没有一个海归,全部中国自己培养。中国大学的科研能力已经起飞。

因此美国的AI竞争虽有资金与高算力晶片的优势,人才不足却将成为弱点。预计今年中国理工科毕业的博士将有7万7千名,超过美国的4万名。而排除各国留学生后的美国本土博士毕业生,则只约2万3千人。虽然科学研究的质量意义超过数量,但更多的博士生通常意味着更多的天才。研发人才数量的悬殊,可能改变原本美国领先的科技优势。

(略)

中国经济政策“挺制造、压金融”

但美国要改革的或许不只教育本身,还要调整经济制度,以提供诱因,鼓励学生研读科学。美国华尔街金童待遇优渥,薪水不高但红利惊人,因而吸引大量优秀人才研读金融,相对科研人才就少。

而中国的经济政策却是:挺制造、压金融。这也是中国大战略的一部分。中国希望最优秀的学生去读理工、搞科研,而不是读金融,赚大钱。
(略)
https://www.chinatimes.com/opinion/20250206000004-262110?chdtv

1 Like

国内用户使用DeepSeek有什么限制吗?例如 必须付费才能使用更高级的功能

没有限制,官网和 app 都是免费的。付费的是 api 接口普通用户用不上。

R1卡死,服务器总是写繁忙

昨天中午开始 DeepSeek 又被攻击了。

昨天看到一个台湾的新闻谈话节目,主持人说看了梁文锋的访谈,说DeepSeek是有盈利的,并没有在烧钱。

搜了一下,没找到他所说的访谈,不过找到一些别的资料。

DeepSeek创办人梁文锋:从量化基金到聊天机器人投资者

DeepSeek由梁文峰于2023年12月创立,并于第二年发布了首个AI大型语言模型。关于这位40岁的创业家,外界知道的并不多。他出生于中国南方城市广东湛江,毕业于浙江大学,专业为电子信息工程和计算机科学。
与许多来自矽谷的美国AI企业家不同,梁先生还有金融背景。他是名为“幻方量化”(High-Flyer)的对冲基金的首席执行官,该基金利用AI分析金融数据以做出投资决策,这被称为量化交易。

2019 年,“幻方量化”成为中国首个募资超过1000亿元人民币的量化对冲基金。

在幻方量化,梁文峰通过使用AI和以及识别可能影响股价的算法模式赚到了钱。他的团队熟练使用AI晶片设计师以及近期华尔街宠儿辉达生产的H800晶片来进行股票交易。2023年,他推出DeepSeek,宣布了开发人类水平人工智能的意图。
DeepSeek创办人梁文锋:从量化基金到聊天机器人投资者 - BBC News 中文

这60条思考,读懂DeepSeek创始人梁文锋的与众不同

24.我们的大模型服务降价只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利,在成本之上稍微有点利润。
25.抢用户并不是我们的主要目的。我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。
32.在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,这就是我们的护城河。

33.开源,发论文,并没有失去什么。对于技术人员来说,被follow是很有成就感的事。开源更像一个文化行为,而非商业行为。给予是一种额外的荣誉,一个公司这么做也会有文化的吸引力。

35.中国AI和美国真实的gap是原创和模仿的差距。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。

37.我们不会闭源,我们认为先有一个强大的技术生态更重要。

38.我们短期内没有融资计划,我们面临的问题从来不是钱,而是高端芯片被禁运。

39.更多的投入并不一定产生更多的创新,否则大厂可以把所有的创新包揽了。

40.我们认为当前阶段是技术创新的爆发期,而不是应用的爆发期。长远来说,我们希望形成一种生态,就是业界直接使用我们的技术和产出,我们只负责基础模型和前沿的创新,然后其它公司在DeepSeek的基础上构建toB、toC的业务。如果能形成完整的产业上下游,我们就没必要自己做应用。

41.如果需要,我们做应用也没障碍,但研究和技术创新永远是我们第一优先级。

45.大模型创业公司可能活下来2到3家。现在都还处在烧钱阶段,那些自我定位清晰、更能精细化运营的,更有机会活下来。其它公司可能会脱胎换骨。有价值的东西不会烟消云散,但会换一种方式。

47.我们发布的V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但我们能自己打造这样的人。

51.创新首先是一个信念问题。为什么硅谷那么有创新精神?首先是敢。Chatgpt出来时,整个国内对做前沿创新都缺乏信心,从投资人到大厂,都觉得差距太大了,还是做应用吧。但创新首先需要自信,这种信心通常在年轻人身上更明显。

52.我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们是有吸引力的。

54.AGI可能是2年、5年或者10年,总之会在我们有生之年实现。至于路线图,即使在我们公司内部,也没有统一意见。但我们确实押注了三个方向:一是数学和代码,二是多模态,三是自然语言本身。数学和代码是AGI天然的试验场,有点像围棋,是一个封闭的、可验证的系统,有可能通过自我学习就能实现很高的智能。另一方面,多模态、参与到人类的真实世界里学习,对AGI也是必要的。我们对一切可能性都保持开放。

56.我主要的精力在研究下一代的大模型,还有很多未解决的问题。

58.我们经历了一个漫长的积累过程,外部看到的是幻方2015年后的部分,但其实我们做了16年。
这60条思考,读懂DeepSeek创始人梁文锋的与众不同_手机新浪网

免费的DeepSeek靠什么赚钱?DeepSeek回答

随后,记者将网友提出的“DeepSeek面对用户免费,怎么赚钱”的问题输入DeepSeek客户端,DeepSeek很快作出书面答复:“面向个人用户的常规功能(如基础问答、信息检索等)可能免费开放,用于吸引用户和积累数据,但高级功能或专属服务需要付费。”DeepSeek进一步解释,如针对企业用户、开发者或高频需求,可能提供付费服务;再比如面向企业或开发者提供API接口、技术支持或定制化服务可能会收费;在免费产品中嵌入广告或与品牌联合推广(例如搜索结果推荐、内容植入)可能会收费等。
最后,DeepSeek总结,平台提供免费和按需付费两种模式,适合不同规模的用户。
免费的DeepSeek靠什么赚钱?DeepSeek回答-华龙网

DeepSeek 昨天自己的公告: APP 和官网完全免费,没有任何付费内容,然后 API 接口的付费充值功能也暂停了,通知说服务器太繁忙了。

也谈不上什么绝地反攻吧,只能做文字互动,而且胡说八道的也不少,功能还差得挺远。近日比较过几种Ai,将相同的几段古文译为现代汉语,deepseek确实译得最好。只是最近试用,10次有8次会说“服务器繁忙,请稍后再试。”大概是受到攻击的结果吧。

服务器繁忙,最主要的原因就是自己服务能力跟不上,CPU、GPU太少,而网络请求很多,这是最简单最直接的解释。动辄说别人ddos攻击之类,也太看得起自己了,你都遥遥领先了,连这么点防护能力都没有?

1 Like

大模型推理对GPU的算力要求是很高的,像deepseek v3 / r1这种模型,671B参数,至少需要 8×H100 (8张 h100 的gpu,每张 80 g高带宽显存)才装得下。按照激活参数37b粗略估算,这样的配置可以支持10-20用户并发访问,文本生成速度大概是40~80 tokens/秒, 50 用户并发访问,速度大约20~30 tokens/秒。即使deepseek像传说中那样有 5 万 H系列的gpu,撑死也只能同时并发支持30-50万用户,那么,算一下中国多少人,全世界又是多少?deepseek突然爆红火了,这时你不瘫痪谁瘫痪,根本用不着谁DDoS攻击。

差很远是怎么说,DeepSeek R1 模型世界第三,不用每月 20 刀,模型开源免费不用翻墙,代码和数学能力排名第一,还有性价比更高的 AI 服务商吗?

1 Like

让我想起高中竞赛生思维了,只要能做出题就行,才不管什么高数,线代与大物内容,取巧性强,过于偏科;思维上也是以为纯数学,物理方法才是普遍适用的,甚至想设计一套从纯数学,物理出发的制度,蔑视其他学科,认为数学,物理才是学科之王。

deepseek就像一个竞赛生,在国际奥数,物理竞赛或是计科上得了不少金牌,但其缺乏全面性,前不久deepseek显示出网安的缺陷,人文学科上近九成错误,道德伦理的匮乏。不过与“竞赛生”交流起来只要对题,还是能聊下去的,而且很有意思,其余的时候,交谈起来有一些三流九等之仰视或蔑视之氛围。

不过我感觉这种氛围也普遍存在中文程序员圈,骄傲自负,骨子里一种认为代码解决一切的味道,或是不假思索的推崇某一家思想,学说而不做思考与解释

DeepSeek 的服务状态看这个页面: