(Sports)云开体育官方网站登顶GitHub Hacker News, 这个开源款式让AI编程老本缩小 98%|深刻新款式

(Sports)云开体育官方网站登顶GitHub Hacker News，这个开源款式让AI编程老本缩小 98%|深刻新款式

文｜李嘉星

剪辑｜周鑫雨

一句话先容

context-mode是一款专为AI编程打造的高下文优化MCP（Anthropic发布的模子高下文合同）插件。

它惩处了开辟者在长周期开辟中碰到的“模子失忆”与“Token过多花消”的核肉痛点。

据团队示意，在编程场景下，context-mode不祥让AI编程的老本缩小98%，同期将大模子的追思力从30分钟陶冶至3小时。

团队布景

context-mode的背后是一支布景多元的跨国初创团队。现时团队的中枢成员散布在土耳其、法国等4个国度，主要通过GitHub异步阿谀。

MertKöseoğlu（中枢开辟者、首创东说念主）：曾四肢技巧照看人为OpenAI等企业提供技巧就业，领有超10年全栈工程与系统架构素养。创业前，他曾先后任职于Countly、Planhat及Jotform等全球闻明数据与SaaS平台，担任高档软件工程师。

孙逸诚（中枢开辟者、多平台适配认真东说念主）：团队里的中国容貌，现时大二在读。他曾入围强基洽商（数学与物理全省前18名），具有Temporal-RAG（时序数据检索增强）引擎的孤苦开辟素养，并取得知乎全球A2A（Agent-to-Agent）黑客松银奖。

家具及业务

图源:context-mode

浅陋来说，context-mode是一款有益为AI编程助手“减负”和“整理追思”的开源MCP插件。

该款式发布后曾登顶GitHubHackerNews，现时已在GitHub取得超1.5万颗Star。context-mode现已蛊惑逾24.3万名开辟者接入，完成了对15个主流平台的底层适配，并被微软、谷歌、Meta、字节跨越及Cursor等科技公司的研发团队摄取。

context-mode之是以能在极客圈取得无数的讲理，恰是因为其精简直中了一个令东说念主头疼的行业急躁：被崇高API账单和大模子失忆逼疯的开辟者

跟着“龙虾（OpenClaw，一个开源Agent框架）”等全自动AI编程智能体的普及，VibeCoding的期骗门槛进一步缩小。

但是，享受到AI带来的效果陶冶的同期，用户很慷慨志到，才能是崇高的：一方面，Claude、GPT等顶尖模子的Token订价并未低廉，包含充足Token额度的高档套餐，订价动辄高达200好意思元/月。

另一方面，受制于当下的才能，在践诺具体任务经由中，模子的反复试错、重迭检索王人会形成很是的Token糜掷。

在本质开辟场景中，大模子常常阐述得像一个“莫得知识的数据处理机器”。团队成员孙逸诚共享了一个踩坑资格：

插足Kaggle数据竞赛时，他将一个包含300组数据的试验任务交给了Claude。为了阐述任务进程，Claude莫得选择写一段定时剧本，而是选择每隔5秒钟向整个这个词款式发起一次全局检索。这种极其低效的“死盯”战术，让一个高配会员账号的API额度在短短半小时内花消了90%。

与此同期，大模子还存在“失忆”的问题。开辟者发现，现代码量涉及某些主流IDE（集成开辟环境）的隐形上限（如164K）时，系统会不得不丢弃或压缩历史信息，导致模子淡忘要害细节。这就导致：前一秒还在流通写代码的AI，下一秒就会把前置的要害架构和收敛要求忘得清清爽爽。

面临大模子严重的“幻觉”与“失忆”，context-mode给出了解法：既然大模子处理海量原始数据又贵又笨，亚博体育中国官网注册登录那就抢劫它径直阅读原始数据的职权。

孙逸诚打了一个比喻：“传统的AI编程就像看一场马拉松，大模子会死死盯着每一个选手的每一步，这固然会耗尽它的高下文。而context-mode作念的，是把赛马拉松的经由扔进一个屏蔽的沙盒（Sandbox）里，大模子只需要看终末的排行肆意。”

具体到责任旨趣，领先，通过引入“捏造沙盒”与精确检索，context-mode不祥有用缩小Token的花消。

在传统的调用模式中，每一次MCP器具的调用王人极其崇高，纷乱的原始数据会被径直倾倒进大模子的高下文窗口，导致Token花消量飞腾。

context-mode的“捏造化沙盒”机制，就好比在大模子和操作系统间设立了全部“防火墙”。它会先把整个文献和运转纪录存放在土产货，需要用到时再帮大模子把关系内容找出来。

《智能深刻》的测试肆意。

把柄《智能深刻》的测试，接入context-mode后，大模子读取一份79.3KB的文献时，Token的花消老本缩小了87.7%。

其次，为了惩处大模子的“失忆”痛点，context-mode通过构建“归档点”，及时监控开辟者的每一次文献剪辑。

当对话太长，它会主动构建并向AI注入一个常常小于2KB的“快照”，(Sports)云开体育官方网站尽头于在代码剪辑经由中设立了一个“归档点”。官方示意，这种机制能将大模子联络编程的有用时刻从30分钟陶冶至3小时。

终末，context-mode引入了强制性“用代码念念考（ThinkinCode）”的范式，从而从简Token花消。

所谓的ThinkinCode，浅陋而言，即是不让模子逐行阅读、处理文献，而是先让模子编写一个“小要道”，让“小要道”先在土产货完成数据分析，再将索求后的肆意反应给模子。

context-mode首创东说念主Mert告诉《智能深刻》，开辟者堕入了一个误区：习气将海量数据径直丢给大模子进行处理。本质上，面临50个文献的数据统计任务，与其让模子切身逐一阅读，不如先让模子写一段剧本，由剧本完成统计责任，再把肆意复返给模子。

用Mert的话说，一个剧本不错替代十几个崇高的器具调用，并从简百倍的高下文。

把柄《智能深刻》的测试，接入context-mode后，模子处理一份文献时，从简了99.98%的Token老本。

context-mode的上手门槛，比Cursor等需要从头下载并恰当环境的孤苦开辟软件（IDE）更低。四肢一个轻量级的MCP（模子高下文合同）插件中间件，context-mode不错径直接入开辟者原有的责任流中。

context-mode团队还提供了一系列快捷辅导，用来稽查各大平台的Token从简情况。用户只需要在聊天框中输入辅导，浏览器就会弹出一个土产货的数据统计面板，纪录着当周调用了若干次API，以及context-mode抑止了若干次无效的数据读取。

△快捷辅导列表。图源:context-mode

近期，context-mode针对企业研发场景，推出了“高下文即就业”。

在企业研发场景中，AI的ROI常常难以揣度。

为此，context-mode推出了企业就业“Insights”。取得授权后，装配在要道员电脑上的插件，不错径直将要道员使用AI的经由数据（比如调用了什么器具、报错了几次、花消了若干钱），发送到Insights场地就业器上。

与此同期，Insights还能针对不同岗亭，提供不同的数据阐述。比如面向安全总监，系统会自动生成安全阐述；面向财务团队，系统不错提供Tokens花消明细。

现时，Insights仍处于定向内测阶段。

Founder念念考

住手将大模子视为“数据处理器”，它本质上是“代码生成器”。

当今好多平台和开辟者堕入了一个误区，可爱把50个文献径直读入高下文，让大模子去内部“数”有若干个函数。

这不仅逐步，况且极其糜掷算力。咱们的目的是“用代码念念考（ThinkinCode）”——LLM应该去编写一个统计剧蓝本完成计数，终末只输出肆意。

一个剧本不错替代十几个崇高的器具调用，并从简百倍的高下文。在已往的AI编程范式中，这是整个平台王人必须服从的底层铁律。

无穷高下文是一个伪命题，克制才是AI器具最难设立的壁垒。

行业里王人在卷大模子的长文本才能（比如100K以致1M的高下文），但这其实是个罗网。把几十KB的报错日记一股脑倾倒给AI，只会加快它的“失忆”和幻觉。

果然的解法不是盲目扩容，而是设立起一套尽头克制的“情状追思层（沙盒）”。谁能把传给AI的无效杂音压缩到极致，谁才能果然帮开辟者把联络编程的时刻从30分钟延迟到3个小时。

下一代AI编程的瓶颈不在于模子够不够贤慧，而在于高下文经管框架够不够明晰。

当今公共王人在仇怨AI会在归并个Bug上反复摔倒。这并不是因为模子变笨了，而是它在冗长的对话中迷失了。

惟有给AI提供像单机游戏相通的归档点，强制它按优先级读取追思，才能为它果然有价值的逻辑推理留出迷漫的空间。

大厂在卷“全家桶”，而咱们在作念跨平台的“全能插座”。

开云2026世界杯中国官网

咱们花无数元气心灵去适配Cursor、Claude、Gemini等不同的底层逻辑，是因为果然的开辟者生态始终是碎屑化且快速迭代的。

开辟者不需要另一个被大厂深度绑定的全能Agent(Sports)云开体育官方网站，他们需要的是一个轻量、不吃内存、即插即用且能极大缩小API账单的中间件。

关于开云

(Sports)云开体育官方网站 登顶GitHub Hacker News, 这个开源款式让AI编程老本缩小 98%|深刻新款式

(Sports)云开体育官方网站登顶GitHub Hacker News, 这个开源款式让AI编程老本缩小 98%|深刻新款式