... | ... | @@ -97,10 +97,9 @@ social_organ |
|
|
taskhub 全量主体信息
|
|
|
```
|
|
|
|
|
|
## 任务输入参数(样例) 其中credit_no、province、company_name为必需
|
|
|
## 任务输入参数(样例) 其中credit_no、company_name必需有其中一个
|
|
|
```json
|
|
|
{
|
|
|
"province": "BJ",
|
|
|
"company_name": "北京市东城区混沌创新学校",
|
|
|
"credit_no": "52110101400789098K"
|
|
|
}
|
... | ... | @@ -108,9 +107,8 @@ taskhub 全量主体信息 |
|
|
|
|
|
### 任务样例
|
|
|
<!--注意是爬虫拿到的完整任务,而不仅仅是task_params-->
|
|
|
```buildoutcfg
|
|
|
```json
|
|
|
{
|
|
|
"province": "BJ",
|
|
|
"company_name": "北京市东城区混沌创新学校",
|
|
|
"credit_no": "52110101400789098K"
|
|
|
}
|
... | ... | @@ -120,8 +118,7 @@ taskhub 全量主体信息 |
|
|
<!--特有参数说明,通用参数比如spider_name,task_params,task_src,task_result等不需说明-->
|
|
|
```json
|
|
|
{
|
|
|
"province": "BJ", -- 任务对应省份
|
|
|
"company_name": "北京市东城区混沌创新学校", -- 任务对应社会组织名称
|
|
|
"company_name": "北京市东城区混沌创新学校", -- 任务对应社会组织名称
|
|
|
"credit_no": "52110101400789098K" -- 任务对应社会组织名称
|
|
|
}
|
|
|
```
|
... | ... | @@ -134,18 +131,22 @@ detail: 详情信息 |
|
|
|
|
|
## 爬虫结果的超级数据
|
|
|
<!--包含所有字段的json数据,每个value都要有样例值-->
|
|
|
```buildoutcfg
|
|
|
```json
|
|
|
{
|
|
|
"http_code": 200,
|
|
|
"error_msg": "",
|
|
|
"task_result": 1000,
|
|
|
"data_type": "detail",
|
|
|
"spider_name": "social_organ",
|
|
|
"task_type": "社会组织",
|
|
|
"spider_start_time": "2021-06-25 09:23:53.251",
|
|
|
"spider_end_time": "2021-06-25 09:23:53",
|
|
|
"task_result": 1000,
|
|
|
"task_params": {
|
|
|
"province": "BJ",
|
|
|
"company_name": "北京市东城区混沌创新学校",
|
|
|
"credit_no": "52110101400789098K"
|
|
|
},
|
|
|
"metadata": {},
|
|
|
"companyinfo_item": {
|
|
|
"area_code": "110000",
|
|
|
"authority": "北京市东城区民政局",
|
... | ... | @@ -183,27 +184,31 @@ detail: 详情信息 |
|
|
|
|
|
## 实际爬虫结果的数据结构
|
|
|
<!--可能与超级数据一致,可能不同的data_type的爬虫结果结构不同,超级数据是把所有data_type的结果组合在一起-->
|
|
|
```buildoutcfg
|
|
|
```json
|
|
|
{
|
|
|
"http_code": 200,
|
|
|
"error_msg": "",
|
|
|
"task_result": 1000,
|
|
|
"data_type": "detail",
|
|
|
"spider_name": "social_organ",
|
|
|
"task_type": "社会组织",
|
|
|
"spider_start_time": "2021-06-25 09:23:53.251",
|
|
|
"spider_end_time": "2021-06-25 09:23:53",
|
|
|
"task_result": 1000,
|
|
|
"task_params": {
|
|
|
"province": "BJ",
|
|
|
"company_name": "北京市东城区混沌创新学校",
|
|
|
"credit_no": "52110101400789098K"
|
|
|
},
|
|
|
"metadata": {},
|
|
|
"companyinfo_item": {
|
|
|
"area_code": "110000", # 行政区划代码
|
|
|
"authority": "北京市东城区民政局", # 登记管理机关
|
|
|
"authority": "北京市东城区民政局", # 登记管理机关
|
|
|
"business_scope": "外语, 对外汉语, 岗位培训等", # 经营范围
|
|
|
"capital": "50万元", # 注册资本
|
|
|
"capital": "50万元", # 注册资本
|
|
|
"company_address": "北京市东城区广渠门内大街35号二层FGY-202-204A", # 社会组织住所
|
|
|
"company_name": "北京市东城区励步摩比培训学校", # 社会组织名称
|
|
|
"company_status": "正常", # 单位状态: 正常,注销,撤销
|
|
|
"company_type": "民办非企业单位", # 社会组织类型
|
|
|
"company_name": "北京市东城区励步摩比培训学校", # 社会组织名称
|
|
|
"company_status": "正常", # 单位状态: 正常,注销,撤销
|
|
|
"company_type": "民办非企业单位", # 社会组织类型
|
|
|
"create_time": "2021-06-25 09:23:53",
|
|
|
"credit_no": "52110101400789098K", # 统一社会信用代码
|
|
|
"data_source": 1,
|
... | ... | @@ -216,12 +221,12 @@ detail: 详情信息 |
|
|
"is_volunte_service": 0, # 志愿服务组织 1是 0否
|
|
|
"lastupdatetime": "2021-06-25 09:23:53",
|
|
|
"legal_person": "曹伟", # 法定代表人姓名
|
|
|
"legal_person_caption": "法定代表人", # 头衔(法定代表人)
|
|
|
"legal_person_caption": "法定代表人", # 头衔(法定代表人)
|
|
|
"oper_status": 0, # 经营异常状态(0正常,1异常)
|
|
|
"operation_enddate": "2024-05-31", # 经营结束日期
|
|
|
"operation_startdate": "2020-05-31", # 经营开始日期
|
|
|
"organizer": "北京市东城区教育委员会",# 业务主管单位/党建工作机构
|
|
|
"province": "北京市", # 省份(中文名称)
|
|
|
"organizer": "北京市东城区教育委员会", # 业务主管单位/党建工作机构
|
|
|
"province": "北京市", # 省份(中文名称)
|
|
|
"province_code": 1013, # 省份(数字编号)
|
|
|
"province_short": "BJ", # 省份(英文缩写)
|
|
|
"search_time": "2021-06-25 09:23:53"
|
... | ... | |