不同的category。和resume的设置方法不一样。
Never Settle
重装系统后配置 Hexo
重装系统后,只是将系统盘格式化了,保留了 HexoBlog 文件夹。
1、 安装 Node.js、安装 Git Bash。
2、 安装 Hexo。
3、 在 Git Bash 中配置 useremail 和 username。
4、 检查 HexoBlog 中的 _config 文件中 deloy 的配置是否正确。type: git; repository: git@github.com:htxf/htxf.github.io.git; branch: master
5、 根据 GitHub 的教程重新再生成 SSH keys (默认在 C:\Users\Administrator 文件夹下)、将其加入到 Git 中、将其加入到 GitHub 中。
PS:如果之前将生成的 ssh 放到其他盘中,重装系统后应该就不用重新生成 ssh key 了吧,只需安装了将其加入Git中,此时GitHub中还保存着之前的sshkey了。
Python爬虫--爬取孙艺珍Instagram上的照片和视频
1. 需求
爬取到孙艺珍Instagram上的所有照片和视频。
2. 解决过程
阶段1
先打开网页,OBOB。
该页面初始时只显示12张照片,通过点击”更多“按钮,屏幕一直往下滚动,会显示更多,直到显示出所有的照片和视频。在此过程中,该网页并没有重新加载。所以新显示出来的照片和视频是通过Ajax技术从服务器获取到的。
之前理解的爬虫一直是找HTML文件中的某些内容,并且根据某些规则不停地更新需要请求的网页列表,这样就不断的有新的HTML文件。
针对现在这种情况。会有两种解决方案?一种是在代码中模拟屏幕滚动,将所有内容都显示出来后,爬下整个HTML,从中找到照片和视频的url(或者边滚动边查找);另一种是直接去找XHR(XmlHttpRequest对象),其中肯定存有照片和视频的url信息。