编程开发
用python批量提取pdf的图片,并存储到指定文件夹
【需求】:继上篇文章我们利用 python 的三方工具库 pdfplumber 批量提取 pdf 的表格数据之后,不少小伙伴提出:大多数pdf都为图片,如何批量提取出图片。今天我们就来用 python 来解决这个问题。
image.png
一、实现效果图
二、基于 fitz 库和正则搜索提取图片
fitz 库是 pymupdf 中的一个模块,用它来提取 pdf 里的图
面试题中的心理学(阿莲的每日一省763)
第一题:“领导给你100块钱,让你买一杯咖啡,可你发现这张纸币是假钞,你该怎么办?”
普通的答案:“赶紧报警”,“我不是私人秘书,工作内容不包括帮老板买咖啡”。
很明显这些回答都没说到点上。
高分答案:
首先,这个问题存在两种假设。
一是老板知道这是假钞,那这种存在人品问题又踩了法律红线的公司,避而远之。
二是老板不知道,这大概也是HR想透过问题去了解的:
当上司在他判断失误的前提下,交给你一项任
面试题:说说地址栏输入 URL 敲下回车后发生了什么?
一、简单分析
简单的分析,从输入 URL到回车后发生的行为如下:
URL解析
DNS 查询
TCP 连接
HTTP 请求
响应请求
页面渲染
二、详细分析
1. URL解析
首先判断你输入的是一个合法的URL 还是一个待搜索的关键词,并且根据你输入的内容进行对应操作
URL的解析第过程中的第一步,一个url的结构解析如下:
2. DNS查询
DNS(D
