Mayo Pickles Newsletter 第 1 期

Mayo Pickles Newsletter #1

1. Tableau

Tableau 是全球领先的数据可视化和商业智能(BI)软件,现隶属于 Salesforce。它支持用户通过简单的拖拽操作快速进行数据分析,生成丰富、交互式的图表和仪表盘,无需编程基础。Tableau 可连接 Excel、SQL、云服务等多种数据源,支持实时数据更新和多端数据整合,便于企业、政府、医疗等多个行业的数据决策。产品包括桌面版、服务器版和云端版,拥有活跃的用户社区和大量学习资源,适用于多场景的数据可视化需求。

image.png

随着业务发展,数据分析以及策略会越来越重要,提前了解哪些可以做很有帮助。不过,对于业务中的数据分析,我们可能要有一个冷静的认识:数据可以告诉我们很多事情,但得到的终究是片面的结果,想要形成产品逻辑,还是需要在数据的基础上进行思考,避免陷入片面数据优化中。

BI 产品非常多:

2. Stanford CS 153: Infra @ Scale - Cursor CTO & Co-Founder Sualeh Asif

Cursor 应该是目前最成功的 AI 辅助编码工具了,在过去一年中规模增长超 100 倍,每天处理约 1 亿次模型调用,索引数十亿文档。Cursor 的 CTO 重点谈了支撑 Cursor 的架构,其核心基础设施包括索引系统和自动补全模型

image.png

业务快速扩张时,架构上压力最大的是数据库?之前似乎听到过类似的问题,数据库的选型其实最简单的反倒是可用性最高的,各种 fancy 的数据库,理论上可能很好,但都需要时间发展,生产环境稳妥的选择很重要。简单稳定(如PostgreSQL)往往优于复杂前沿(如Yugabyte)。

3. 深度|Cursor CEO最新访谈:编程会消失,未来IDE不再是工具,而是一个会写、会跑、会自我优化的智能体

近期 Cursor CEO 的一个访谈,介绍了起初做 Cursor 时的一些想法和 Cursor 的近况。未来编程将不再只是写代码,而是人机协作,通过高级抽象语言与 AI 代理共同构建软件系统。AI 会逐步改变编程工作流程,提升效率,同时程序员将更多专注于设计和优化,而非重复劳动。

image.png

访谈中 Cursor 的 CEO 提到了希望做有大量用户使用的产品,这样可以有更多反馈,帮助优化模型做的更好。在大模型之前的 AI 时代,经常说掌握数据的企业会有更大资源,但 LLM 时代这种讲法似乎变少了,原因可能是把反馈收集起来重新训练一次模型成本太高了,很难快速迭代。已经能被大模型消耗的数据已经不剩很多了,想要再优化大模型,可能真的需要靠反馈了。

这次 LLM 发展的确实太快了,以至于人们很容易就变得非常浮躁,觉得模型未来会越来越好,能力原来越强,现有的很多事情最终都会没有意义。但未来不会不来,什么时候来都尚未可知,还是要把眼前的事情做好,避免过于浮躁。

4. GitHub 的 CEO 要去创业了

他不是 GitHub 的创始成员,早期创业后被微软收购,在微软一路晋升上来的,在 GitHub 的主要工作是推进的 GitHub Copilot。

GitHub Copilot 目前发展速度确实很有限(虽然商业上很成功),不知道是决策层觉得进展有限要换人,还是他自己觉得 GitHub 不够敏捷要另起炉灶。

这次调整以后,有报道说 GitHub 在微软不再独立运营了,而是融合进了 AI 项目组。这也引发了大家对 GitHub 私有 repo 是否会被用于训练 AI 的担忧。

https://www.theverge.com/news/757461/microsoft-github-thomas-dohmke-resignation-coreai-team-transition

image.png

5. I used NotebookLM to “watch” a show, and honestly, I might do it again

作者没有时间看剧,所以尝试了用 NotebookLM 总结剧集的内容来学习这部剧发生了什么,提示词都很直接:

Imagine I’m using you as a substitute for actually watching The Queen’s Gambit. I want to fully understand the show’s plot, tone, character growth, and major turning points, as if I just binge-watched it. Walk me through everything I need to know, like you’re my nerdy friend who just finished the series and is telling me all about it.

效果确实很不错,甚至了解的内容比自己看还要清晰。但我觉得看这些剧,享受的更多是其中的过程(各种情绪),知道剧情本身这些“知识”并没有用。

同样的,自己看一本书和用 LLM 总结“看”一本书的区别又是什么呢?

6. 国际化设计指南

国际化不只是翻译,而是从设计与开发起支持多语言、多文化和不同数据格式的整体工作。

要分离文本与资源、提供翻译风格指南、考虑文本长度与读写方向并镜像必要的 UI 元素。

处理好货币、日期、单位、图像与文化差异,可提升用户体验并推动品牌全球化。

团队经常因为阿拉伯语的阅读顺序导致 UI 问题,之前一直以为是我们的业务中东用户比较多,今天才知道阿拉伯语本身的使用人口非常多:“它是世界上第四大语言,估计有 4.22 亿人使用 26 个阿拉伯语国家。”

7. I Reverse-Engineered Claude Code: Learn These Agent Tricks

尝试逆向 Claude Code 的代码,但是失败了,于是直接拦截看 Claude Code 发出的请求。发现 Claude Code 使用了大量非常详细的 Prompts,工作流并不是用代码实现的,而是全由 Prompt 来完成的。

所以是不是 LangGraph 这种用处越来越小了?一个 tool 调用嵌套循环就够了,所有 workerflow 全都用 prompt 来写。

关于系统提示词的一些发现:

  1. 最重要的工作流,例如在完成每一步后需要更新 TODO 列表,需要不断的重复提及,在不同的章节都要提到,才能有稳定的效果。
  2. 基本所有的工作流都是用 Prompt 来实现的。
  3. Prompt 的格式非常重要,Claude Code 会使用 XML 标签来分割不同的部分。

8. 李想×罗永浩!四小时马拉松访谈!李想首度公开讲述 25 年创业之路

罗永浩开了新播客(播客行业药丸?)第一期采访了李想,时长非常长聊了非常多内容。一些点:

  • 李想最一开始并不是直接做网站起家的,而是先帮人装机,为媒体投稿做显卡测评。进行基于内容做了显卡之家,泡泡网。
  • 创业时越困难,越容易自己抗不告诉其他合伙人,导致其他人联合想要罢免李想。但其实每个人都想被需要,越有困难越应该拉上大家一起想办法,团队才能更凝聚。
  • 谈到马斯克睡在工厂,李想说他从来没有这样过,他讲了三个原因:自己的合伙人非常厉害,可以充分放权;中国的供应链和制造能力非常强,相比美国的工厂员工素质要高得多;马斯克自己非常懂技术,长时间待在工厂确实可以有明显的贡献。

9. 【锤子科技发布会】20170509 坚果Pro

播客中罗永浩提到了自己的坚果 pro 发布会,前面一个小时拿着一个完全抄 iPhone 样式的手机讲了半天,说自己是为了迎合市场,下面的人都脸色难看了。到最后再大反转,拿出了一个与 iPhone 设计风格完全不同的手机样式,引起了非常好的反响。会看了一下当时的发布会,一是好奇前面的实机演示到底是拿的抄袭 iPhone 的样机还是后面有棱有角的设计,可能是故意让看不清的话;另一个是觉得这个发布会一个小时的演习,还挺冒险的。

10. The /llms.txt file – llms-txt

一个类似 rebot.txt 的文件规范,让 LLM 来消费,其中的内容可以让 LLM 理解页面的功能等。

怎么自动化的生成这份内容是个大问题,难不成以后要专门开发一个平铺版本无样式的页面供 LLM 消费?