PaddleOCR学习笔记 01-PaddleOCR简介
《PaddleOCR学习笔记 01-PaddleOCR简介》涵盖了PaddleOCR的基础介绍、OCR技术概览、PaddleOCR的开源状态及主要算法,包括文字检测与识别算法、百度自研的SAST、SRN和End2End-PSL等,以及9m超轻量模型的介绍。适合初学者入门学习。
阿里云视觉系统使用技巧
【10月更文挑战第3天】阿里云视觉系统基于强大的计算能力和人工智能技术,为用户提供了多种图像处理与分析的解决方案。无论是图像识别、目标检测,还是视频分析,阿里云视觉系统都能帮助开发者和企业实现自动化、高效化的图像处理任务。本文将分享一些阿里云视觉系统的实用技巧,帮助你更好地使用这款强大的工具。
轻松抓取:用 requests 库处理企业招聘信息中的联系方式
本文详细介绍如何利用Python的`requests`库结合代理IP技术,突破Boss直聘的登录验证与反爬虫机制,抓取企业招聘信息中的联系方式。文章首先阐述了Boss直聘数据抓取面临的挑战,随后介绍了代理IP轮换、登录会话保持及请求头伪装等关键技术。通过一个完整的示例代码,展示了从配置代理、模拟登录到解析HTML获取联系方式的具体步骤。此方法不仅适用于Boss直聘,还可扩展至其他需登录权限的网站抓取任务。
纯前端RAG:使用Transformers.js实现纯网页版RAG(一)
本文将分两部分教大家如何在网页中实现一个RAG系统,本文聚焦于深度搜索功能。通过浏览器端本地执行模型,可实现文本相似度计算和问答匹配,无需依赖服务器。RAG搜索基于高维向量空间,即使不完全匹配也能找到意义相近的结果。文中详细介绍了如何构建知识库、初始化配置、向量存储及相似度计算,并展示了实际应用效果。适用于列表搜索、功能导航、文档查询及表单填写等多种场景。
分享5款极大提升效率的小工具
本文推荐了五款高效实用的软件工具,包括简洁高效的便签工具Knotes、精准的文字识别工具天若OCR、多功能在线平台3171.cn、涵盖视频编辑与文件加密的GiliSoft,以及轻量级内存优化工具Memreduct。这些工具能够显著提升学习和工作的效率,是解决各类问题的得力助手,值得尝试。