分类 :

python

python号称爬虫利器,不管做seo还是网站建设的,都是必须掌握的编程语言了,一起来看看吧。

pycharm开发python项目,报错:UnicodeEncodeError: 'gbk' codec can't encode character '\ube44' in position 17: illegal multibyte sequence

pycharm开发python项目,报错:UnicodeEncodeError: 'gbk' cod

1.报错信息:UnicodeEncodeError: 'gbk' codec can't encode character '\ube44' in position 17: illegal multibyte sequence2.报错翻译:UnicodeEncodeError:“gbk”编解码器无法对位置 17 中的字符“\ube44”进行编码:非法多字节序
Tag标签:[ python , PyCharm ] 编辑:[] 分类:[python]
python selenium+ChromeDriver

python selenium+ChromeDriver

在做爬虫的时候,很多网站,都有限制访问,像要绕过这些限制,可以考虑用python selenium+ChromeDriver的方案。这里安装了几个库,浏览器自动化操作库selenium,另一个是自动下载ChromeDriver库webdriver-managerpip install seleniumpip install selenium-wirepip install selenium web
Tag标签:[ ChromeDriver , python , selenium ] 编辑:[] 分类:[python]
Aho-Corasick算法 - ac算法

Aho-Corasick算法 - ac算法

简称ac算法,用来分词用的,还有一个tree树算法,也是分词用的,不过ac更有优势pyahocorasick这是Aho-Corasick算法实现的python库这个不是单纯的python库,是c++实现,所以需要c++编译支持不然执行安装就会报错pip install pyahocorasick就会报错error: Microsoft Visual C++ 14.0 or greater is r
Tag标签:[ ac算法 , Aho-Corasick , 算法 ] 编辑:[] 分类:[python]
python常用模块整理

python常用模块整理

整理一下python常用的模块import os os.getcwd() #获取当前工作目录,即当前python脚本工作的目录路径 os.chdir("dirname") #改变当前脚本工作目录,相当于shell下cd os.curdir #返回当前目录: ('.') os.p
Tag标签:[ python ] 编辑:[] 分类:[python]
python+phantomjs抓取js渲染后的网页内容

python+phantomjs抓取js渲染后的网页内容

phantomjs官方下载地址:https://phantomjs.org/download在Python中的具体使用方法phantomjs属于selenium库,所以使用方法很简单from selenium import webdriver driver=webdriver.PhantomJS(executable_path=r'E:/Python/phan
Tag标签:[ phantomjs , python , selenium ] 编辑:[] 分类:[python]
宝塔搭建python网站

宝塔搭建python网站

我这里直接用宝塔搭建python网站宝塔之前主要用宝塔第三方插件“Python项目管理器”不过现在宝塔有自带的python项目管理器,我觉得使用起来更加的方便在网站-python项目-python版本管理安装最新版就可以了端口自行开放框架用flask运行方式选uwsgi网络协议选wsgi启动用户选www通行方式选http运行配置最后一行添加:callable = app
Tag标签:[ python , 宝塔 ] 编辑:[] 分类:[python]

Copyright © 千欧中软 版权所有 https://www.qozr.com seo | 网站建设 [渝ICP备15005074号] 渝公网安备50011802011077