... | @@ -32,6 +32,44 @@ class CourtNoticeItem(PinganBaseSpiderItem): |
... | @@ -32,6 +32,44 @@ class CourtNoticeItem(PinganBaseSpiderItem): |
|
|
|
|
|
```
|
|
```
|
|
|
|
|
|
|
|
### 归集到227目录的数据直接入mysql表
|
|
|
|
```
|
|
|
|
CREATE TABLE `hearing_announcement` (
|
|
|
|
`id` bigint(20) NOT NULL AUTO_INCREMENT,
|
|
|
|
`unique_id` varchar(50) NOT NULL COMMENT '唯一索引,根据规则生成的MD5',
|
|
|
|
`court_name` varchar(255) DEFAULT NULL COMMENT '法院',
|
|
|
|
`court_room` varchar(50) DEFAULT NULL COMMENT '法庭',
|
|
|
|
`contractors` varchar(50) DEFAULT NULL COMMENT '承办部门',
|
|
|
|
`start_date` datetime DEFAULT NULL COMMENT '开庭日期',
|
|
|
|
`plan_date` date DEFAULT NULL COMMENT '排期日期',
|
|
|
|
`case_code` varchar(255) DEFAULT NULL COMMENT '案号',
|
|
|
|
`action_cause` varchar(50) DEFAULT NULL COMMENT '案由',
|
|
|
|
`case_type` varchar(30) DEFAULT NULL COMMENT '案件类型',
|
|
|
|
`case_area` varchar(100) DEFAULT NULL COMMENT '案件管辖区域',
|
|
|
|
`plaintiff` varchar(1023) DEFAULT NULL COMMENT '原告/上诉人',
|
|
|
|
`defendant` varchar(1023) DEFAULT NULL COMMENT '被告/被上诉人',
|
|
|
|
`litigant` varchar(1023) DEFAULT NULL COMMENT '当事人',
|
|
|
|
`judge` varchar(50) DEFAULT NULL COMMENT '审判长/主审人',
|
|
|
|
`title` varchar(2000) DEFAULT NULL COMMENT '标题',
|
|
|
|
`article` longtext COMMENT '公告内容',
|
|
|
|
`province` varchar(20) DEFAULT NULL COMMENT '省份',
|
|
|
|
`source_data` longtext COMMENT '原始数据',
|
|
|
|
`domain` varchar(50) DEFAULT NULL COMMENT '域名',
|
|
|
|
`use_flag` int(11) DEFAULT NULL COMMENT '使用标志0正常,1人工已修正,2调试中,3未解析,9删除废弃',
|
|
|
|
`create_time` datetime DEFAULT NULL COMMENT '入库时间',
|
|
|
|
`update_time` datetime DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',
|
|
|
|
`is_hide` tinyint(4) DEFAULT '0' COMMENT '是否不展示',
|
|
|
|
`desc02` varchar(255) DEFAULT NULL COMMENT '预留字段',
|
|
|
|
`desc03` varchar(255) DEFAULT NULL COMMENT '预留字段',
|
|
|
|
PRIMARY KEY (`id`),
|
|
|
|
UNIQUE KEY `idx_unique_id` (`unique_id`) USING BTREE,
|
|
|
|
KEY `idx_use_flag` (`use_flag`) USING BTREE,
|
|
|
|
KEY `idx_start_date` (`start_date`) USING BTREE,
|
|
|
|
KEY `idx_update_time` (`update_time`) USING BTREE
|
|
|
|
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;
|
|
|
|
|
|
|
|
```
|
|
|
|
|
|
## 数据名称(中文)
|
|
## 数据名称(中文)
|
|
|
|
|
|
<!-- 该项数据的中文标准名称,后续沟通交流使用的规范名称,如:工商公示股东信息、失信被执行人、一般纳税人等-->
|
|
<!-- 该项数据的中文标准名称,后续沟通交流使用的规范名称,如:工商公示股东信息、失信被执行人、一般纳税人等-->
|
... | @@ -433,7 +471,7 @@ scrapy |
... | @@ -433,7 +471,7 @@ scrapy |
|
## 爬虫结果目录
|
|
## 爬虫结果目录
|
|
|
|
|
|
```
|
|
```
|
|
/data/judicature_spiders
|
|
/data/judicature_spiders/hearing_announcement
|
|
```
|
|
```
|
|
|
|
|
|
## 归集后存放目录
|
|
## 归集后存放目录
|
... | | ... | |