用户测评|DeepSeek-OCR,你用了吗?
推荐语
DeepSeek-OCR实测体验:从文字识别到图表估算,这款AI工具带来了哪些惊喜?
核心内容:
1. 多场景测试:文字、表格、图表识别及标注功能表现
2. 使用技巧:中英文提示词差异及官方推荐模板
3. 独特亮点:无数据图表估值功能与Markdown转换实用价值

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
作者|Simon,硅基流动用户
我是 Simon,一个资深asp.net程序员,现在是一名独立的 AI 技术研发者,研发出多项 AI 应用于具体场景的技术,其中一项正在申请国家发明专利,已过初审。我会继续努力,争取有更大的进步。
OCR 模型我用过几款,也一直在关注,比如我有一个诉求是识别工业 CAD 图片,这是行业痛点之一,有一个具体场景是在图纸上高亮显示当前加工的工序,为后面的加工做提示。
DeepSeek-OCR 发布后,听说用了革命性的技术,就很好奇。
我写了一个页面用 WebAPI调用硅基流动中这款模型,为了呈现效果也写了一些相关辅助的程序。先从最简单的有一些文字的图片开始,各种提示词都试试;然后尝试表格、图表的识别;再来几张照片看看模型能不能读懂;最后尝试在图上标注。咱一起看看 DeepSeek-OCR 的表现。





以上几个场景基本能让我们看到 DeepSeek-OCR 的能力,不过我在测试的过程中也有点过山车的感觉,满心期待开始,遇到问题很疑惑,各种尝试后又有小惊喜。
DeepSeek-OCR 你用过了吗?也想听听你的使用心得。
上手体验 DeepSeek-OCR,硅基流动「限时免费」~

近期更新
硅基流动推出企业级MaaS
硅基流动上线阿里Qwen-VL-32B
2秒出图!Qwen-Image系列登陆BizyAir
硅基流动上线DeepSeek-OCR,限时免费
硅基流动企业级MaaS助电力巨头效能狂飙
提效300%,大模型一体机加速药企报告撰写


大模型技术大模型技术原理大模型技术应用