
文|李嘉星
剪辑|周鑫雨
一句话先容
context-mode是一款专为AI编程打造的高下文优化MCP(Anthropic发布的模子高下文合同)插件。
它惩处了开辟者在长周期开辟中碰到的“模子失忆”与“Token过多花消”的核肉痛点。
据团队示意,在编程场景下,context-mode不祥让AI编程的老本缩小98%,同期将大模子的追思力从30分钟陶冶至3小时。
团队布景
context-mode的背后是一支布景多元的跨国初创团队。现时团队的中枢成员散布在土耳其、法国等4个国度,主要通过GitHub异步阿谀。
MertKöseoğlu(中枢开辟者、首创东说念主):曾四肢技巧照看人为OpenAI等企业提供技巧就业,领有超10年全栈工程与系统架构素养。创业前,他曾先后任职于Countly、Planhat及Jotform等全球闻明数据与SaaS平台,担任高档软件工程师。
孙逸诚(中枢开辟者、多平台适配认真东说念主):团队里的中国容貌,现时大二在读。他曾入围强基洽商(数学与物理全省前18名),具有Temporal-RAG(时序数据检索增强)引擎的孤苦开辟素养,并取得知乎全球A2A(Agent-to-Agent)黑客松银奖。
家具及业务

图源:context-mode
浅陋来说,context-mode是一款有益为AI编程助手“减负”和“整理追思”的开源MCP插件。
该款式发布后曾登顶GitHubHackerNews,现时已在GitHub取得超1.5万颗Star。context-mode现已蛊惑逾24.3万名开辟者接入,完成了对15个主流平台的底层适配,并被微软、谷歌、Meta、字节跨越及Cursor等科技公司的研发团队摄取。
context-mode之是以能在极客圈取得无数的讲理,恰是因为其精简直中了一个令东说念主头疼的行业急躁:被崇高API账单和大模子失忆逼疯的开辟者
跟着“龙虾(OpenClaw,一个开源Agent框架)”等全自动AI编程智能体的普及,VibeCoding的期骗门槛进一步缩小。
但是,享受到AI带来的效果陶冶的同期,用户很慷慨志到,才能是崇高的:一方面,Claude、GPT等顶尖模子的Token订价并未低廉,包含充足Token额度的高档套餐,订价动辄高达200好意思元/月。
另一方面,受制于当下的才能,在践诺具体任务经由中,模子的反复试错、重迭检索王人会形成很是的Token糜掷。
在本质开辟场景中,大模子常常阐述得像一个“莫得知识的数据处理机器”。团队成员孙逸诚共享了一个踩坑资格:
插足Kaggle数据竞赛时,他将一个包含300组数据的试验任务交给了Claude。为了阐述任务进程,Claude莫得选择写一段定时剧本,而是选择每隔5秒钟向整个这个词款式发起一次全局检索。这种极其低效的“死盯”战术,让一个高配会员账号的API额度在短短半小时内花消了90%。
与此同期,大模子还存在“失忆”的问题。开辟者发现,现代码量涉及某些主流IDE(集成开辟环境)的隐形上限(如164K)时,系统会不得不丢弃或压缩历史信息,导致模子淡忘要害细节。这就导致:前一秒还在流通写代码的AI,下一秒就会把前置的要害架构和收敛要求忘得清清爽爽。
面临大模子严重的“幻觉”与“失忆”,context-mode给出了解法:既然大模子处理海量原始数据又贵又笨,亚博体育中国官网注册登录那就抢劫它径直阅读原始数据的职权。
孙逸诚打了一个比喻:“传统的AI编程就像看一场马拉松,大模子会死死盯着每一个选手的每一步,这固然会耗尽它的高下文。而context-mode作念的,是把赛马拉松的经由扔进一个屏蔽的沙盒(Sandbox)里,大模子只需要看终末的排行肆意。”
具体到责任旨趣,领先,通过引入“捏造沙盒”与精确检索,context-mode不祥有用缩小Token的花消。
在传统的调用模式中,每一次MCP器具的调用王人极其崇高,纷乱的原始数据会被径直倾倒进大模子的高下文窗口,导致Token花消量飞腾。
context-mode的“捏造化沙盒”机制,就好比在大模子和操作系统间设立了全部“防火墙”。它会先把整个文献和运转纪录存放在土产货,需要用到时再帮大模子把关系内容找出来。

《智能深刻》的测试肆意。
把柄《智能深刻》的测试,接入context-mode后,大模子读取一份79.3KB的文献时,Token的花消老本缩小了87.7%。
其次,为了惩处大模子的“失忆”痛点,context-mode通过构建“归档点”,及时监控开辟者的每一次文献剪辑。
当对话太长,它会主动构建并向AI注入一个常常小于2KB的“快照”,(Sports)云开体育官方网站尽头于在代码剪辑经由中设立了一个“归档点”。官方示意,这种机制能将大模子联络编程的有用时刻从30分钟陶冶至3小时。
终末,context-mode引入了强制性“用代码念念考(ThinkinCode)”的范式,从而从简Token花消。
所谓的ThinkinCode,浅陋而言,即是不让模子逐行阅读、处理文献,而是先让模子编写一个“小要道”,让“小要道”先在土产货完成数据分析,再将索求后的肆意反应给模子。
context-mode首创东说念主Mert告诉《智能深刻》,开辟者堕入了一个误区:习气将海量数据径直丢给大模子进行处理。本质上,面临50个文献的数据统计任务,与其让模子切身逐一阅读,不如先让模子写一段剧本,由剧本完成统计责任,再把肆意复返给模子。
用Mert的话说,一个剧本不错替代十几个崇高的器具调用,并从简百倍的高下文。
把柄《智能深刻》的测试,接入context-mode后,模子处理一份文献时,从简了99.98%的Token老本。
context-mode的上手门槛,比Cursor等需要从头下载并恰当环境的孤苦开辟软件(IDE)更低。四肢一个轻量级的MCP(模子高下文合同)插件中间件,context-mode不错径直接入开辟者原有的责任流中。
context-mode团队还提供了一系列快捷辅导,用来稽查各大平台的Token从简情况。用户只需要在聊天框中输入辅导,浏览器就会弹出一个土产货的数据统计面板,纪录着当周调用了若干次API,以及context-mode抑止了若干次无效的数据读取。

△快捷辅导列表。图源:context-mode
近期,context-mode针对企业研发场景,推出了“高下文即就业”。
在企业研发场景中,AI的ROI常常难以揣度。
为此,context-mode推出了企业就业“Insights”。取得授权后,装配在要道员电脑上的插件,不错径直将要道员使用AI的经由数据(比如调用了什么器具、报错了几次、花消了若干钱),发送到Insights场地就业器上。
与此同期,Insights还能针对不同岗亭,提供不同的数据阐述。比如面向安全总监,系统会自动生成安全阐述;面向财务团队,系统不错提供Tokens花消明细。
现时,Insights仍处于定向内测阶段。
Founder念念考
住手将大模子视为“数据处理器”,它本质上是“代码生成器”。
当今好多平台和开辟者堕入了一个误区,可爱把50个文献径直读入高下文,让大模子去内部“数”有若干个函数。
这不仅逐步,况且极其糜掷算力。咱们的目的是“用代码念念考(ThinkinCode)”——LLM应该去编写一个统计剧蓝本完成计数,终末只输出肆意。
一个剧本不错替代十几个崇高的器具调用,并从简百倍的高下文。在已往的AI编程范式中,这是整个平台王人必须服从的底层铁律。
无穷高下文是一个伪命题,克制才是AI器具最难设立的壁垒。
行业里王人在卷大模子的长文本才能(比如100K以致1M的高下文),但这其实是个罗网。把几十KB的报错日记一股脑倾倒给AI,只会加快它的“失忆”和幻觉。
果然的解法不是盲目扩容,而是设立起一套尽头克制的“情状追思层(沙盒)”。谁能把传给AI的无效杂音压缩到极致,谁才能果然帮开辟者把联络编程的时刻从30分钟延迟到3个小时。
下一代AI编程的瓶颈不在于模子够不够贤慧,而在于高下文经管框架够不够明晰。
当今公共王人在仇怨AI会在归并个Bug上反复摔倒。这并不是因为模子变笨了,而是它在冗长的对话中迷失了。
惟有给AI提供像单机游戏相通的归档点,强制它按优先级读取追思,才能为它果然有价值的逻辑推理留出迷漫的空间。
大厂在卷“全家桶”,而咱们在作念跨平台的“全能插座”。
开云2026世界杯中国官网咱们花无数元气心灵去适配Cursor、Claude、Gemini等不同的底层逻辑,是因为果然的开辟者生态始终是碎屑化且快速迭代的。
开辟者不需要另一个被大厂深度绑定的全能Agent(Sports)云开体育官方网站,他们需要的是一个轻量、不吃内存、即插即用且能极大缩小API账单的中间件。