2016年10月18日星期二

新浪微博第三方登录的python实现

这是来自一个朋友的项目,需要在美拍用微博账号授权登录,我再本项目的技术力量薄弱

我可能在python算是入门了,但是web那块我还是空白的,我只知道http协议的基本工作过程 对于细节方面,要用到很多没少用的模块,比如 httplib, urllib, urllib2, htmllib等
  • 你可能需要Ipython
因为ipython是交互性的,测试代码非常方便,而且帮助功能也非常齐全。
ipython3 安装(适用于python3)
pip3 install ipython
pip3 install ipython[all]
ipython 安装(适用于python2.7)
pip install ipython
  • 究竟如何实现自动化,怎么实现最好?

 

1.模拟浏览器的模块

mechanize
pyv8
上面两个模块的简单介绍
Splinter : 简单介绍
selenium : demo使用详解

 

2.python调用其他py脚本返回值

我的需求是这样的,python2.7下面运行不了python3的代码
只能用调用的形式,而不能使用import的形式
使用os模块,调用系统命令执行
os.system('python3 /home/xxx.py') 只能返回0
os.popen('python3 /home/xxx.py') 这可以将脚本返回值进行导出

 

3.模拟http报文发送的模块

urllib2

urllib.urlencode() 是urllib2没有的方法,而这又是经常使用的功能

httplib

  • httplib 与 urllib 的区别
httplib比urllib更为底层,urllib很多实现都需要调用httplib
ps:
httplib2详细使用指南
httplib详细使用指南

 

urllib in python3

urllib跟urllib2变成一个package urllib,而不是模块
import urllib.request
import urllib.parse
Request = urllib.request.Request(url) 

 

解析html数据的两个模块 htmllib 与 beautifulsoup

htmllib的使用远比Beautifulsoup要麻烦很多,htmllib一定要修改基类才能够按照自定义的标签提取方法
而BeautifulSoup只要很简单的几行代码就可以实现,htmllib要写很多代码才可以实现,所以不推荐使用htmllib

BeautifulSoup 官方中文文档
BeautifulSoup 安装
BeautifulSoup 入门
BeautifulSoup 详解
BeautifulSoup 系列教材4篇

python3 BeautifulSoup 模块导入方法:
import bs4
from bs4 import BeautifulSoup
python2.7 BeautifulSoup 模块导入方法:
from bs4 import BeautifulSoup
 
HTMLParser 官方文档
HTMLParser 模块详解
HTMLParser 实际案例

configParse 与 json 模块

Python ConfigParser的使用
python3中用configparser对配置文件的读写
json编码与解码(官方文档)

 

没有评论:

发表评论