我做了个能在浏览器里跑的手写数字串识别
用 CRNN/CTC、合成数据训练和 ONNX Runtime Web,拆解一个纯前端手写数字串识别项目怎么从约束推导出技术路线。
关注产品思考、写作与成长,在创造与复盘中持续迭代自己。
关于我
我叫 Yoryon,目前在北京邮电大学读本科,专业是信息与计算科学。
关注 AI 产品方向,喜欢把 LLM 应用、Agent 工作流和模型评测这些事拆解清楚再落地成产品,并通过写作沉淀认知、记录成长。
正在做的事:从用户场景、机制设计到工程协作,把 AI 能力跑成真实可用的产品。
最近的思考与写作
用 CRNN/CTC、合成数据训练和 ONNX Runtime Web,拆解一个纯前端手写数字串识别项目怎么从约束推导出技术路线。
用 Minimax、Alpha-Beta 剪枝和手写棋型评估,拆解一个纯前端五子棋 AI 如何决定每一步落子。
拆解 Cursor Composer 2.5 的训练栈改进:Targeted RL、25 倍合成数据、Sharded Muon 与双网格 HSDP。
拆解 MCP、Skills、Harness 三个概念的边界:MCP 接外部手,Skills 装内部脑,两者互补,都运行在 Harness 之内。
姚顺宇对谈张小珺:从物理到 AI,关于 Anthropic 组织能力、AI 本质的简单性及 long horizon 的下一步。
精选项目
面向中外合办与国际交流项目学生的低信任陌生人社交,用"每周报名、统一揭晓、低压破冰"的批量匹配机制替代即时滑动配对。
系统衡量奖励模型能否识别不同用户对同一任务的偏好差异,覆盖 Chat、Writing、Reasoning、Safety 四类场景。
把代码审查、问题定位、数据采集与内容生产等高频任务,拆解为可复用的标准化 AI 协作 Skill。