Python 读取Excel(xlsx)文档中的链接
微信公众号导出的文章统计数据xlsx 文档结构如下。需要用到的数据第6行起,第1列是标题及链接,第3列是发表日期。
php方式解构excel文档已经做过了,最近都是拿python练手,顺便就试试在py中完成这个任务
下文无特别说明是python3.x代码,需要跳过弯路看正确解决方案的的直接跳到最后方案
微信公众号导出的文章统计数据xlsx 文档结构如下。需要用到的数据第6行起,第1列是标题及链接,第3列是发表日期。
php方式解构excel文档已经做过了,最近都是拿python练手,顺便就试试在py中完成这个任务
下文无特别说明是python3.x代码,需要跳过弯路看正确解决方案的的直接跳到最后方案
对自己2019年的全部博客做了分词统计,用的是python的分词组件 jieba
https://github.com/fxsjy/jieba
使用方法很简单我就略过不说了
直接看结果,全年的口头禅或者使用的最多的词top10分别是(词,词频)。
'可以', 70
'一个', 59
'问题', 59
'这个', 59
'需要', 55
'文件', 52
'如果', 49
'下载', 45
'安装', 44
'执行', 41
项目中有个功能需求,对部分图像的浏览做鉴权。未授权前能粗略分辨照片但又要保证原图不被下载保护私隐。虽然一行CSS也可能做到模糊效果,但这种处理手法手略懂前端知识的人可以轻易绕过。所以比较慎重的做法还是后端先对图像预先处理。
把需求进一步简单推理概括的话,就是给图像加上马赛克或做模糊处理。脑子里有个2个比较相似方案。
方案1. 对图像加工(缩小)成仅满足前端显示需要的尺寸,对全图加马赛克处理;
方案2. 对图像加工成更小(大约60x60)的小缩略图,在前端做拉伸覆盖显示,像素在浏览器端拉扯成马赛克(我还真是个逻辑鬼才)
原图(blog做了resize):
方案一加马赛克:
方案二缩小成图标大小再拉伸平铺
构思初步成型,顺便也来比较一下两种做法的处理效率。
少量中文通过GET方式传参,到了PHP端解码出现乱码或内容丢失。
原因及解决办法
url参数会对 编码字串内的 +
号解释为空格,所以在 decode 之前做一下逆操作就可以解决。
$str_b64 = $_GET["msg"]; //base64编码的字符串
$str_b64 = str_replace(" ","+",$str_b64);
$str_raw = base64_decode($str_b64); //解码
最近摸索前端canvas画布和后端图像加工相关的一些功能。写了个练手程序,为了让前端(js控制css)预览的体验与后端php图像处理一致。总结了几点经验。
先上成品,表情包生成器:
https://gen8.orz.com.cn/mymeme
*此文并非系统且科普的教学,讲述的内容基于我个人备忘比较跳跃和零散。
这几个目标遇到问题较多的是预览前端的涂鸦区预览 与 后端生成图片的一致性。