当前位置： ag凯发k8国际 > 人工智能 > chatgpt >内容正文

chatgpt

excel图片地址直接显示图-ag凯发k8国际

发布时间：2024/10/8 chatgpt 0 豆豆

ag凯发k8国际收集整理的这篇文章主要介绍了 excel图片地址直接显示图_图片转表格基于百度ai 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

失踪日久，皆因进来学业繁重，其实就是没好好学习。偶遇一有趣需求，方才始更一篇。
需求如下：图片内表格，需直接将图片转换为excel表格。

初步构想，迅捷在线转换，奈何没找到直接转换，图片转pdf再转为excel又过于繁琐，结合当下opencv及百度ai的学习更番如下：

首先想到使用opencv库(laplace算子)进行图像锐化，此处说明由于多数图像为白纸黑字所以锐化是十分有必要的，识别文字边框，进而进行图片中文字识别。但因受限于网络图片清晰度及受限于本身pc的算力等原因造成识别结果差异化严重所以最终放弃。(但是后期会补上代码)此次识别过程结果如下，不理想。

进而开始另求它法，因为最近在学习计算机视觉相关内容，所以各大ai平台的公开接口是绕不开的。本次使用的百度ai大脑开放的ocr接口，识别精度肯定比个人pc的强，毕竟算力的差距在那。插一句，我个人是一直认为百度的技术积累是bat三家里面最好的，也是最值得期待的。

本次使用的百度开放给公共用户的通用文字识别接口，为求精度本次使用的是高精度版本：https://ai.baidu.com/tech/ocr/general

高精度版本在通用文字识别(标准版)的基础上，提供更高精度的识别服务，支持更多语种识别(丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语)，并将字库从1w 扩展到2w ，能识别所有常用字和大部分生僻字。

开发语言选取python，也是最近一直在学，没办法，学人工智障绕不开的。

在准备开发之前首先确保你已经完成了百度ai平台的注册，申请到了orc识别的接口，一般申请都会过的，万一你没过，反思一下最近是不是在哪捡钱了。

接口请求方式采用post

post和get这两种请求方式各位在面向对象程序设计应该都学过，当然这里不确保你有对象哈！

请求url：https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic重点圈起来，这个请求的地址是统一的。

然后你需要获取到个人接口的access_token，这里的access_token类似于你微信的id，确保你调用接口返回参数的唯一性。
百度ai的开发文档给出了多种获取access_token的方式，我最建议的还是内嵌到你的程序中去。

返回参数提供了json/excel两种可选(哈哈哈哈哈哈哈哈，难道百度知道我要转excel)，选择request_type类型为：excel，然后循环写入excel文档。因未能识别框线所以还是需要手动注线，后期笔者努力尽快解决。识别结果：

注：注意开发过程中的个人sessionid和key的正确性，转换结果文档默认保存到了当前工程目录下！

近期会持续更新一些考研相关的注意事项，以及opencv的相关内容和关于ocr识别的案例。
本次工程git链接：https://github.com/sevnxiaolu/ptt.git
感谢star！
最后希望各位最后10天好好复习，上岸成功！

以上是ag凯发k8国际为你收集整理的excel图片地址直接显示图_图片转表格基于百度ai的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得ag凯发k8国际网站内容还不错，欢迎将ag凯发k8国际推荐给好友。