心在此处,只登一步

我有个改变世界的想法,现只缺一个程序员

2025.05.25

今天内容有些长,记录下关于AI编程的一些思考。

(1)

一段时间以来,一直有个想法(Idea):做一套自己的资讯系统,为自己梳理每天重要的资讯,汇总成一份简报,供自己阅读。

为何想做这件事呢?

现在每天资讯满天飞,每条资讯都阅读了解,这一天什么都不干了也读不完;但是不读资讯的话,又担心错过一些重要讯息。

最好的方式是,有人或者有一套工具,能够把一天中的讯息收集整理,把其中比较重要的、自己可能感兴趣的内容梳理出来,做成摘要,供自己快速浏览,碰到自己感兴趣的内容,还可以详细阅读。这样既可以节省时间,又能较全面的掌握一天内的讯息。

早些年,「得到」上有个付费专栏叫「李翔商业内参」,大体上就是做类似的事情,人工帮人汇总一天内重要的信息,提供给阅读者。一年的订阅费用199元,记得订阅量有十多万,可见有类似需求的人大有人在!可惜的是,这档专栏后来停更了,估摸着这个模式可能难以持续成一个「大生意」,估专栏团队解散了。

因没啥其他更好的选择,就萌生了自己做一套类似功能的资讯系统,主要是自己来用。想法产生了许久,自己一直没有行动,原因在于自己缺乏实现这套资讯系统所需的技术能力,故而这么一个想法,始终停留在想法阶段,未能付诸行动。

想起来早年知乎上的一个段子:有人声称,他有一个改变世界的Idea,只缺一个程序员!我当时的状态,大体就是这个段子描述的状态。

(2)

近来,我决定正式推动「资讯系统」想法的执行落地,立一个自己的小项目,因为我发现,「程序员」的问题,不再成为问题。

正好前些时候,看到一个大V的案例。这位大V做了一套知识管理系统,跟我想要做的资讯系统其实有些类似。这位大V也不具备技术开发能力,但是他利用现如今的AI技术,一点点的把他自己的想法实现成具体的技术和产品,他的这种能力和精神,还是很值得学习的。

这位大V使用的核心AI技术是AI编程的技术。说白了,就是他只提供想法和思路,交给AI编程的工具来给他写代码,他再做一些集成和整合,把各种技术拼接在一块,就初步完成了他想要的系统。

这么做的难点有两个:其一是找到合适的AI编程工具;其二是对自己要做的东西思考的足够细致,细致到功能(function)层面。

这两点都难不到我,对技术这块,虽然自己很多年不写代码,但还是基本了解的,寻找到合适的AI编程工具不算难,把自己要做的东西思考到功能层面也可以做得到。

因此,现在我还是有信心利用业余时间,使用AI编程工具,给自己搞一套还不错的资讯系统。

(3)

先研究了下AI编程工具,目前市面上还是有不少的:

  • Cursor:当前最火热的一款AI编程工具(估值以达90亿美金),类似于支持生成式 AI 聊天机器人的模型,如 OpenAI 的 GPT-4o 和 Claude 3.7 Sonnet;它提供了代码补全、解释、重构和基于自然语言描述的完整函数生成等功能;它具有免费版,但收费版本的功能更强大;

  • Windsurf:另一款全球火热的AI编程工具(30亿美元被OpenAI收购),基于基于VS Code开发,其核心功能的Cascade,可以完成自动写代码、找bug、甚至自动发布等AI辅助功能;目前是Cursor的最大竞争对手,也提供免费版和收费版两个版本,同样收费版本功能更强大;

  • Trae:由字节跳动推出的一款AI IDE,基于VS Code编辑器,支持智能代码生成与优化、AI驱动的交互模式(包括Chat和Builder模式)、多模态支持、原生中文支持,并集成主流AI模型如Claude 3.5和GPT-4o;它适用于快速原型开发、团队协作与跨职能开发、编程学习与实践、跨语言开发和代码调试与优化等场景‌;

  • Roo Cline:一个开源的VS Code插件,支持多种大语言模型(如DeepSeek-v3),可以实现类似Cursor Composer的功能,包括基于项目跨文件编程;它适用于需要低成本AI编程的开发者,尤其是对价格敏感的用户‌;

  • Cline:一个开源的AI助手插件,深度集成在VS Code中,支持通过多种模型(如Claude 3.5、Gemini 2.0)实现复杂的软件开发任务,具备文件创建与编辑、命令行集成、浏览器操作等功能;它适用于需要灵活配置AI模型的开发者,尤其是对开源工具感兴趣的用户‌;

  • Void:一款开源的Cursor替代品,基于VS Code架构,支持智能代码补全、代码生成、代码解释等功能,同时支持本地模型运行,确保数据隐私;它适用于对数据安全有较高要求的开发者以及喜欢开源工具的用户‌;

  • TabNine:一个AI驱动的代码自动完成工具,可以轻松集成到多种代码编辑器中,如VSCode、Atom、Sublime Text等;它支持任何语言,包括Python、JavaScript、C++等,并提供免费和付费版本;尽管免费版本功能强大,但付费版本包含更多功能‌;

  • Kite:一个AI驱动的编码助手,在Python开发者中广受欢迎。它提供智能代码完成和实时文档功能,简化不熟悉的代码编写;虽然它在Python方面表现出色,但也支持JavaScript、Java和C++等语言‌;

上面列了一部分AI编程的工具,目前这个赛道里还是比较拥挤的。其实国内阿里的通义灵码、百度文心快码、腾讯的CodeBuddy等,也都是类似的AI编程工具,各有优劣,根据需要可以做不同的选择(开发微信小程序,推荐小程序编辑器+CodeBuddy,原生支持)。

目前我重点尝试使用的是Trae和Void,使用它们的原因是它们免费,其中Void还是开源的,可以参考借鉴它的开发思路。Cursor和Windsurf也体验了基础版,和限期的收费版(2周免费使用),功能很强大,就是订阅价格着实不便宜。

后续,重点先重点试用Trae,先把我想要的资讯系统的demo搭起来,同时熟悉下AI编程工具使用的逻辑和技巧,后续根据使用中遇到的问题,做工具的调整。

(4)

其次,关于「资讯系统」的构建思路,也是基本清晰的,主要是分为三部分:

  • 资讯采集:从多个信息源采集资讯,包括网页(例如36kr、新浪网等)、公众号(自己关注的公众号)、聚合信息网站、音视频内容的抓取等;每个信息源都可以找到相应的资讯和信息抓取的技术工具,所需要做的是把这些技术工具做整合;

  • 资讯清洗:抓取到的资讯和信息,进行去重(相同或相似的进行去重),对内容进行清洗和格式化,对内容进行分类打标,过滤自己不感兴趣的内容;而后对内容进行质量打分,只保留质量分较高的内容;最后再做摘要;

  • 资讯展示:通过页面或者文本的方式对资讯进行摘要,或者通过newsletter的方式,给自己发邮件;

每一部分的内容都可以再进一步的细化,细化到一步一步的功能层面。对于每一步的功能,通过向AI编程工具提需求的方式,让AI工具生成代码,人工对代码做一定的审计,确保可用。就这样,尝试一步一步的实现自己要的资讯系统。

上面的思路和执行步骤,说起来简单,相信实现起来会遇到N多的困难和挑战。不过没关系,本身做这件事情也是一种尝试:对于没有较强技术能力的人,能否借助AI编程工具来实现自己的想法。

如果这次尝试成功了,可以初步证明,只要你有想法,你是可以借助AI编程工具来实现它,缺少「程序员」不再是一个借口!

(5)

再记录几条关于AI编程方面的思考,未必正确,仅供参考。

今年,看到N多AI大厂在AI编程能力上下功夫,例如阿里的通义大模型要投入大量资源提升大模型编程能力,OpenAI于5月6日收购Windsurf以补足自身大模型在AI编程方面的不足。

为何大家这么看重AI编程的能力呢?

  • AI大模型有极强的编程能力的话,真正能够做到:人们只需要有个创意想法即可,AI工具可以帮你来实现它们。如此这般,会让人们的创造力得到极大的发挥;

  • 在AI大模型编程能力的加持下,企业或者个人的软件需求可以实现真正意义上的定制化,根据企业或个人的自身需求,自己定制自己所需要的软件;如此这般,整个软件行业都会被彻底颠覆,这一切的关键在于AI大模型的编程能力——掌握这个能力,也就掌握了未来软件世界的基础设施!

  • AI大模型当前的能力主要还是体现在数字空间里的智能,AI大模型更广泛的应用空间是物理世界,借助具身智能的机器身体,AI大模型可以与真实的物理世界进行交互。AI大模型做为大脑,操作「机械身体」,做任何它想要做的动作,而「机械身体」执行动作所需的指令是各种代码。过往,机器人的动作都是设置好的程式化的动作,AI大模型大脑具备极强编码能力的话,完全可以根据外界的「刺激」生成「应激」的代码,进而指挥身体执行动作——这些动作不再是固定的、程式化的,而是如真实人类一般,由「大脑」发出指令做出的不可预测的灵活的动作!

也许,AI编程能力,不仅仅是一种能力,而是下一个世界的入口。





  • 20250526,修改文章;
  • 20250525,文章初稿;