scrapy 在pycharm 中为什么没有代码提示？

2024-05-13

1. scrapy 在pycharm 中为什么没有代码提示？

response是你自定义的函数中的参数，
python是弱类型，response可以是任意类型，所以没法自动提示
你看到的有自动提示的地方，response绝不是这样定义的

2. 已经写好的scrapy爬虫文件，为什么我的pycharm运行不了，我室友的pycharm可以运行？

直接在命令行或者idle运行，看看会不会是pycharm的问题。
如果不是，那可能就是其他问题，可以用virtualenv试试。

3. python 爬虫代码没有报错，但是没有输出

因为你没有调用qiushi函数啊所以就没有输出

python 爬虫代码没有报错，但是没有输出

4. python3.6自学教程，用pyCharm的，有没有Scrapy框架的教程

在利用pycharm安装scrapy包是遇到了挺多的问题。在折腾了差不多折腾了两个小时之后总算是安装好了。期间各种谷歌和百度，发现所有的教程都是利用命令行窗口安装的。发现安装scrapy需要的包真是多的要死啊。没有专门针对pycharm安装的。因此这里将自己的安装经验分享一下，希望能帮助一些pythoner少走一些弯路（废话到此为止，下面正题。。）
首先呢，你肯定要安装好了pycharm了，然后就是利用伟大的pycharm的自动查找安装第三方包，pycharm可以帮你找到大多数的第三方包，不需要你自己去网上查找和下载了。他会自动查找符合你添加python解释器的第三方模块。
然后就要告诉你在哪里可以利用pycharm安装第三方的包了，首先打开pycharm的左上角的File然后找到setting的选项
打开了setting之后就像上图选定的蓝色的选项，然后就会出现已经安装好了的第三方的包。有没有发现图片的右侧有一个绿色的加号，点进那个加号，然后就会出现如下的窗口。


然后你想要什么包直接在搜索框中搜索就行啦，搜索到之后就会自动帮你选中，然后点击下面的intall Package就ok啦。安装成功了就会给你一个绿色的成功的提示的信息，如果安装失败了就会有一个红色的error的提示。如果安装失败了也不要着急，一般安装失败的原因是，你要安装的包还需要其他包的支持，因此你就去百度谷歌呗，看看还需要什么包，然后按照顺序一步步的来就行。
然后开始安装模块吧，既然要安装scrapy包，那你就要按照下面的顺序来安装了。


按照从下往上的顺序安装就可以。
安装好了之后你就可以愉快的使用Scrapy了。

这里还有一个问题需要特别注意，这个问题也是特别的重要的。那就是虽然你已经安装好了Scrapy但是还要在在环境变量中添加你的Scrapy。
这次按装我顺便也学会了如何去添加系统的环境变量（说来惭愧啊，一直没有用命令窗口来写过python程序，所以自己的python的路径都没有添加到环境变量中）
这里顺便说一下如何添加环境变量吧（这里针对的是win7）。
首相打开计算机的属性，然后点击高级系统设置，


然后点击环境变量，


找到了图中标记了的Path，选中之后点击下面的编辑，然后在出现的路径的后面加分号；，然后就开始添加你的python解释器的路径，如C:\Python27,然后继续添加你的scrapy所在的文件夹（一定要注意前面添加；）如我的是在 H:\Users\heng\AppData\Roaming\Python\Scripts
然后就大功告成了。
然后就是创建scrapy的工程了
在空目录下按住Shift键右击，选择“在此处打开命令窗口”，输入一下命令：
scrapy startproject tutorial

5. 在用pycharm使用爬虫的时候正则表达式中的内容输出不出来

如下：
a.特殊符号需要加转移符：如要匹配'china.com'，则正则表达式格式应为'china\\.com'；
b.字符集（使用中括号[]来包含字符串组成字符集）：如[a-z]表示匹配从a到z之间的字符；此外，还有一个反转字符集，使用^符号开头：如[^abc]表示匹配除了a、b、c三个字符之外的字符；
c.选择符：如要匹配'python'和'page'，写出来的模式为'python|page'，其中‘|’是管道符号；
d.子模式：如‘p(ython|age)’；

在用pycharm使用爬虫的时候正则表达式中的内容输出不出来

6. python 爬虫入门问题Crawler?Scrapy?模块urlib?requests?

因为urllib 是python自带的库，requests是第三方的，功能类似urllib。scrapy 是个爬虫框架，如果你是入门爬化建议还是先学点python基础。至于爬虫requests可以，scrapy也可以。主要还是懂原理，http 协议和ajax，反扒的机制等等

7. python爬虫，运行后没有反应？求助！

python 爬虫用scrapy好了，简单，使用异步twisted库，性能刚刚的。
仔细检查正则表达，先看content是否有内容，有，估计就是正则表达式不对吧。一步步打印啊

python爬虫，运行后没有反应？求助！

8. 学Python爬虫一定要学scrapy模块吗

不一定。
Scrapy是个框架，很多轮子不用自己这写了。
不过Scrapy比较“重”，如果是小型、单一的爬虫任务，我觉得自己重头写反而比较轻便快速，够用就好。
题主是不是刚开始学爬虫，如果是，建议先理解爬虫的几个模块，理解了原理再学Scrapy才会有效率。我理解的模块有如下几个：
访问页面，用requests，知道get和post方法来获得网页的html代码。如果页面用到ajax之类动态加载的，可以通过分析原码爬人家的json(学习下python里json的包)，或者了解一下selenium（不到万不得以不太推荐）的用法。
提取html里的内容，就是我们要爬的内容啦，这个方法有很多，比如正则式，比如xpath，比如BeautifulSoup等等，我主要是用xpath，复杂一点的情况会配合正则用。
保存，程序里，是存在字典还是列表还是pandas的DateFrame,就看你个人需要啦。程序外，可以直接存成txt、excel或者放进数据库，python这方面的现在的库也很多，教程也很多。
Scrapy在以上提到的基本模块基础上还加入了其他功能，如果哪天楼主觉得以上的模块不够用可以试着先自己造个小轮子，比如通过代理来换ip等等。等理解了这些模块时再学scrapy也不迟，而且事半功倍。至于安装问题，pip install scrapy不就能解决吗。。