|
|
# title1
|
|
|
# 数据来源
|
|
|
|
|
|
https://www.icris.cr.gov.hk/csci/
|
|
|
|
|
|
# 主体类型
|
|
|
|
|
|
company_major_type: 10
|
|
|
|
|
|
# 爬虫相关
|
|
|
|
|
|
[爬虫工作流转表]()
|
|
|
|
|
|
# 主要业务字段
|
|
|
|
|
|
|
|
|
| 维度 | 字段名 | 注释 | 样例 |
|
|
|
| ------ | ------ | ------ | ------ |
|
|
|
| | company_name | 公司名称 | 設計方塊裝飾工程有限公司 |
|
|
|
| | en_name | 英文名 | CUBIC CONCEPTS DECORATION ENGINEERING LIMITED |
|
|
|
| | company_code | 公司编号 | 3080876 |
|
|
|
| | company_type | 公司类别 | 私人股份有限公司 |
|
|
|
| | establish_date | 成立日期 | 2021-08-31 |
|
|
|
| 公司资料 | company_status | 公司现况 | 仍注册 |
|
|
|
| | remark | 备注 | |
|
|
|
| | liquidation_mode | 清盘模式 | |
|
|
|
| | cancel_date | 已告解散日期/不再是独立实体日期 | |
|
|
|
| | mortgage | 押记登记册 | 无 |
|
|
|
| | imp_matters | 重要事项 | |
|
|
|
| | province_short | 地区省份 | Hk |
|
|
|
|
|
|
| 维度 | 字段名 | 注释 | 样例 |
|
|
|
| ------ | ------ | ------ | ------ |
|
|
|
| | change_field | 变更类型 | 使用名称 |
|
|
|
| 变更记录 | change_date | 变更日期 | 2021-08-31 |
|
|
|
| | use_name | 变更中文名 | 設計方塊裝飾工程有限公司 |
|
|
|
| | use_en_name | 变更英文名 | CUBIC CONCEPTS DECORATION ENGINEERING LIMITED |
|
|
|
|
|
|
# 上线MongoDB数据结构
|
|
|
|
|
|
```json
|
|
|
{
|
|
|
"spider_name": "hongkong_company_spider",
|
|
|
"task_result": 1000,
|
|
|
"spider_start_time": "2021-09-01 14:51:00",
|
|
|
"spider_end_time": "2021-09-01 14:52:00",
|
|
|
"task_params": {
|
|
|
"company_name": "設計方塊裝飾工程有限公司",
|
|
|
"company_code": "3080876",
|
|
|
"search_key": "3080876"
|
|
|
},
|
|
|
"companyinfo_item": {
|
|
|
"company_name": "設計方塊裝飾工程有限公司",
|
|
|
"en_name": "CUBIC CONCEPTS DECORATION ENGINEERING LIMITED",
|
|
|
"company_code": "3080876",
|
|
|
"company_type": "私人股份有限公司",
|
|
|
"establish_date": "2021-08-31",
|
|
|
"company_status": "仍注册",
|
|
|
"remark": "",
|
|
|
"liquidation_mode": "",
|
|
|
"cancel_date": "",
|
|
|
"mortgage": "",
|
|
|
"imp_matters": "",
|
|
|
"company_major_type": 10,
|
|
|
"province_short": "HK",
|
|
|
"province": "香港",
|
|
|
"area_code": "810000",
|
|
|
"changes_hk": [
|
|
|
{
|
|
|
"change_field": "使用名称",
|
|
|
"change_date": "2021-08-31",
|
|
|
"use_name": "設計方塊裝飾工程有限公司",
|
|
|
"use_en_name": "CUBIC CONCEPTS DECORATION ENGINEERING LIMITED"
|
|
|
}
|
|
|
],
|
|
|
"change_hk_size": 1,
|
|
|
"data_source": 1,
|
|
|
"data_status": 1,
|
|
|
"create_time": "2021-09-01 15:07:00",
|
|
|
"lastupdatetime": "2021-09-01 15:07:00"
|
|
|
}
|
|
|
}
|
|
|
|
|
|
```
|
|
|
|
|
|
# 特殊主体库表结构
|
|
|
|
|
|
```sql
|
|
|
CREATE TABLE utn_special.`special_hongkong_company` (
|
|
|
`id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '自增主键',
|
|
|
`province_short` varchar(5) DEFAULT NULL COMMENT '省份(英文缩写)',
|
|
|
`company_name` varchar(255) NOT NULL COMMENT '公司名称',
|
|
|
`company_id` char(32) NOT NULL COMMENT '主体唯一键',
|
|
|
`company_code` varchar(50) DEFAULT NULL COMMENT '公司编号',
|
|
|
`company_type` varchar(255) DEFAULT NULL COMMENT '公司类别',
|
|
|
`establish_date` date DEFAULT NULL COMMENT '成立日期',
|
|
|
`company_status` varchar(100) DEFAULT NULL COMMENT '公司现况',
|
|
|
`remark` varchar(1000) DEFAULT NULL COMMENT '备注',
|
|
|
`liquidation_mode` varchar(255) DEFAULT NULL COMMENT '清盘模式',
|
|
|
`cancel_date` date DEFAULT NULL COMMENT '已告解散日期/不再是独立实体日期',
|
|
|
`mortgage` varchar(255) DEFAULT NULL COMMENT '押记登记册',
|
|
|
`imp_matters` varchar(255) DEFAULT NULL COMMENT '重要事项',
|
|
|
`use_flag` tinyint(4) DEFAULT NULL COMMENT '使用标记,0有效,10废弃删除',
|
|
|
`create_time` datetime DEFAULT CURRENT_TIMESTAMP COMMENT '入库时间',
|
|
|
`update_time` datetime DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',
|
|
|
PRIMARY KEY (`id`),
|
|
|
UNIQUE KEY `idx_digest` (`company_id`),
|
|
|
KEY `idx_company_name` (`company_name`),
|
|
|
KEY `idx_company_code` (`company_code`),
|
|
|
KEY `idx_create_time` (`create_time`),
|
|
|
KEY `idx_update_time` (`update_time`)
|
|
|
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
|
|
|
|
|
|
|
|
|
CREATE TABLE utn_special.`special_hongkong_company_history` (
|
|
|
`id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '自增主键',
|
|
|
`company_id` char(32) NOT NULL COMMENT '主体唯一键',
|
|
|
`change_record` char(32) NOT NULL COMMENT '变更记录',
|
|
|
`change_field` varchar(200) DEFAULT NULL COMMENT '变更类型',
|
|
|
`change_date` date DEFAULT NULL COMMENT '变更日期',
|
|
|
`use_name` varchar(255) DEFAULT NULL COMMENT '变更中文名',
|
|
|
`use_en_name` varchar(255) DEFAULT NULL COMMENT '变更英文名',
|
|
|
`use_flag` tinyint(4) DEFAULT NULL COMMENT '使用标记,0有效,10废弃删除',
|
|
|
`create_time` datetime DEFAULT CURRENT_TIMESTAMP COMMENT '入库时间',
|
|
|
`update_time` datetime DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',
|
|
|
PRIMARY KEY (`id`),
|
|
|
unique key `idx_change` (`company_id`, `change_record`),
|
|
|
KEY `idx_create_time` (`create_time`),
|
|
|
KEY `idx_update_time` (`update_time`)
|
|
|
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
|
|
|
|
|
|
``` |
|
|
\ No newline at end of file |