2026年2月底,杭州的一家科技公司用连续五天的线上发布会,悄然划下了一道分水岭。当大多数人的目光还停留在通用大模型的参数竞赛上时,智诊科技选择了一条更务实也更艰难的路——他们不造无所不能的“神”,而是造了一个能真正走进家庭、记住每个人健康轨迹的“守护者”。
这五天,智诊科技讲的不是孤立的技术,而是一个完整的故事:如何让AI从能说会道进化为真正懂你。
故事的第一天,从一份被延误五年的病历开始。
一位58岁的患者,2020年因单侧肢体僵硬被诊断为帕金森病,2022年出现尿失禁等自主神经症状,2024年吞咽困难,直到今年才被确诊为多系统萎缩症——五年,错过了最佳干预窗口。问题出在哪?不是医生不专业,而是传统AI只看得见当下,看不见时间。每一次问诊都是重新开始,无法把2020年的症状和2024年的恶化连成一条线。
智诊科技的第一把钥匙,就是给AI装上真正的记忆。全新升级的Wise MemOS 2.0不再依赖外挂数据库,而是把记忆长在模型里。新旧信息在内部实时融合、动态更新,重要的连接被强化,无关的信息自动淡出——这恰好像人类大脑在睡眠中完成的突触修饰。在权威的Locomo记忆能力评测中,这项技术让得分从去年的64%跃升至95.8%,提升了近32个百分点。
有了记忆,还需要一双能看清病灶的眼睛。第二天,WiseDiag V2正式亮相。
这是一次从纯文本问答到多模态理解的跨越。以前的模型只能读文字,但医疗场景天生就是多模态的——片子、化验单、皮肤照片,信息往往藏在图像里。智诊联合50余位三甲医院专家,对3万多例真实病历进行深度拆解,不只标注这是什么病,更标注为什么是这个病的推理路径。
成果很快在国际榜单上得到验证。在OpenAI发布的医疗评测集HealthBench中,WiseDiag V2跑出67.2分,全球领先。在MedBench中文医疗大模型评测中,它以69.8分位居榜首。但比分数更有说服力的,是真实的病例。
一个刚满月的宝宝,摆在医生面前的是三样东西:一张胸部X光片、一张足部外观照、一张血常规化验单。普通模型只能各说各话,WiseDiag V2却把这些碎片串了起来:X光片锁定了食管闭锁和半椎体发育异常,足部照识别了马蹄内翻,化验单读出了吸入性肺炎的风险。最终给出的诊断是VACTERL联合征——一种症状分散、极易被当成几个不相干毛病的罕见病。它能看见每一个孤立的病灶,更能把它们拼成一个完整的人。
第三天,智诊让AI学会犹豫。
医疗不是问答题。一位北大医学部出身的医生在发布会上坦言,遇到拿不准的指标时,他会战术性停顿——翻指南、查文献、请教主任。这种犹豫,恰恰是对生命负责的表现。而过去的AI太自信,不管懂不懂张嘴就来。
WiseResearch要做的,就是让AI学会犹豫和查证。它像一个医疗版的哆啦A梦,口袋里装着三个核心工具:MedOCR精准识别医学单据上的每一个符号,连代表指标异常的箭头都不会漏掉;MedDB收录了40万条经过专家审核的知识条目,覆盖1.2万种疾病,每条都标注了证据等级和时效性;MedSearch则拥有权威优先、时效优先的策略,能直接检索到NCCN 2026年最新版指南。
当一张包含免疫球蛋白、甲状腺激素、尿常规等多项指标的复杂化验单上传后,WiseResearch没有急着回答。它先调用MedOCR精准提取数据,发现甲状腺球蛋白抗体异常升高、血清轻链比值偏低,然后针对性地多次调用MedDB和MedSearch进行检索与校验。直到手里的证据链完整了,它才给出结论:自身免疫性甲状腺炎,但目前功能正常,无需吃药只需复查。每一条建议后面,都附上了刚查到的指南出处。在智能诊所医学问答榜单上,WiseResearch拿下了64.8分,比人类医生的平均分高出整整10分。这10分不是赢在知识量,而是赢在绝对理性的执行力——无论面对第1个还是第100个病人,它都会严格执行检索-核对-校验的标准动作。
第四天,智诊把目光投向了更远的地方:如何衡量一个医疗AI是否真的可靠?
传统学术榜单更像在考记忆和做题,选择题式考试考的是背书,不是临场应变。智诊推出的DoctorBench评测体系,用2大核心维度、3大通用维度、5大专项模块,综合考量医疗AI的知识、思维、安全和人文。准确性是底线,安全性是红线,还有交互质量、信息优先级、主动追问——它会问需要我帮你整理一份给医生的病情摘要吗?这种追问,让AI从给建议升级到管到底。
五天的发布,最终落点在一个普通人的微信里。
第五天,好伴AI小程序正式上线。不需要下载,不需要注册,微信里搜一下就能用。更关键的是,它可以被拉进家庭群聊——妈妈在群里发一句今天有点头晕,好伴AI立刻响应并追问:“头晕多久了?有没有恶心?血压多少?”子女在外地,也能实时看到AI的专业建议和风险提示。
在杭州临平区,这项技术已经服务了191支家庭医生团队,累计服务近百万人次。在区第一人民医院,55位专家的“AI分身”上线两周,仅一位专家的分身就处理了超过1000人次的咨询。一位怀孕31周的孕妇因胎动频繁向AI分身咨询,系统结合过往产检数据,识别出D-二聚体异常偏高、存在胎盘早剥风险,及时提醒她就医,最终化险为夷。
从记住你八年的体检趋势,到看懂你皮肤上的蝶形红斑,再到在家庭群里第一时间回应那句“今天有点不舒服”——智诊科技用五天时间,把医疗AI从论文里的参数,变成了每个人手机里的守护者。
正如他们在发布会上说的:“医疗AI的终点,不是把问题回答得多漂亮,而是让更多人少生一次病、晚生一次病、轻一点生病。”2026年,让AI医疗真正开始拥有生命力。