负责导出数据的组件称为Exporter(导出器),Scrapy内部导出器为:
1 | { |
想要导出其他格式的需要实现Exporter,例如将数据以Excel格式导出
- 首先在
setting.py
同级目录下创建一个python文件 - 书写代码
1 | from scrapy.exporters import BaseItemExporter |
添加了新的导出数据格式需要在settings.py
中添加
1 | FEED_EXPORTERS = { |
导出数据需要提供的信息
- 导出文件路径
- 导出数据格式
导出方式
- 通过命令行
- 通过配置文件
通过命令行
1 | -o 指定文件导出路径 -t 指定导出格式 |
通过配置文件
参数
FEED_URI
导出文件路径
FEED_FORMAT
导出数据格式
FEED_EXPORT_ENCODING
导出文件编码(默认情况json使用数字编码,其他使用utf-8)
FEED_EXPORT_FIELDS
导出数据包含字段(默认全部导出)
FEED_EXPORTERS
用户自定义Exporter字典,添加新的导出格式