西部数码主机 | 阿里云主机| 虚拟主机 | 服务器 | 返回乐道官网
当前位置: 主页 > 开发教程 > python教程 >

使用Python获取行政区划码

时间:2016-02-14 00:51来源:未知 作者:好模板 点击:
国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,写了个Python程序将这部分数据抓取下来,具体的代码如下:(注意抓取下来以后还要进行简单的

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,写了个Python程序将这部分数据抓取下来,具体的代码如下:(注意抓取下来以后还要进行简单的人工的整理)

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
importrequests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
defget_xzqh():
    html_data = requests.get(base_url).content
    pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
    areas = re.findall(pattern,html_data)
    print "code,name,level"
    for areain areas:
        printarea[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
    get_xzqh()

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库。

(责任编辑:好模板)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
热点内容