Skip to content

GitLab

  • Projects
  • Groups
  • Snippets
  • Help
    • Loading...
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
    • Contribute to GitLab
  • Sign in / Register
K
kb
  • Project overview
    • Project overview
    • Details
    • Activity
    • Releases
  • Repository
    • Repository
    • Files
    • Commits
    • Branches
    • Tags
    • Contributors
    • Graph
    • Compare
  • Issues 2
    • Issues 2
    • List
    • Boards
    • Labels
    • Service Desk
    • Milestones
  • Merge requests 0
    • Merge requests 0
  • Operations
    • Operations
    • Incidents
  • Analytics
    • Analytics
    • Repository
    • Value Stream
  • Wiki
    • Wiki
  • Members
    • Members
  • Activity
  • Graph
  • Create a new issue
  • Commits
  • Issue Boards
Collapse sidebar
  • granite
  • kb
  • Wiki
    • Requirement_doc
  • license_creditchina

license_creditchina · Changes

Page history
update: 行政许可需求文档 authored Oct 30, 2021 by 宋志鹏's avatar 宋志鹏
Hide whitespace changes
Inline Side-by-side
Showing with 186 additions and 0 deletions
+186 -0
  • requirement_doc/license_creditchina.md requirement_doc/license_creditchina.md +186 -0
  • No files found.
requirement_doc/license_creditchina.md 0 → 100644
View page @ f02d1775
信用中国行政许可
# 来源网站
信用中国双公示信息查询:https://www.creditchina.gov.cn/xinxigongshi/xinxishuanggongshi/
# 网站情况
可查询主体类型:
- [x] 企业
- [ ] 合作社
- [ ] 个体户
- [x] 事业单位
- [x] 社会组织
- [ ] 律师事务所
- [ ] 党政机关
- [ ] 工会
可查询主体状态:
- [x] 在营
- [ ] 注销
- [ ] 吊销、未注销
- [ ] 迁出
- [ ] 迁入
信息获取方式:
- [x] 通过主体名称/统一信用代码查询
- [ ] 公布列表可遍历
信息展示:
* 目前发现行政许可信息字段有两套,如下:
| 信息1 | 信息2 |
| ---- | ----- |
| 行政许可决定文书号 | 行政许可决定书文号 |
| 行政许可决定文书名称 | |
| 许可证书名称 | |
| 许可类别 |审核类型 |
| 许可编号 | |
| 许可决定日期 | 许可决定日期 |
| 有效期自 | |
| 有效期至 | 许可截止日期 |
| 许可内容 | 许可内容 |
| 许可机关 | 许可机关 |
| 许可机关统一社会信用代码 | |
| 数据来源单位 | |
| 数据来源单位统一社会信用代码 | |
| | 许可有效期 |
| | 数据来源 |
* 数据展示重复
* 同一企业、同一行政许可决定书文号有多条数据,其数据来源不同,一条来源于省、一条来源于地市
# 采集与存储
### 主要业务字段
| 字段 | 样例 |
| ---- | ---- |
| 行政许可决定文书号 | 潍银保监复﹝2021﹞91号 |
| 行政许可决定文书名称 | 潍坊银保监分局关于同意山东寿光农村商业银行股份有限公司文庙街分理处终止营业的批复(OA) |
| 许可证书名称 | |
| 许可类别 | 核准 |
| 许可编号 | |
| 许可决定日期 | 2021-10-18 |
| 许可有效期 | |
| 有效期自 | 2021-10-18 |
| 有效期至 | 2099-12-31 |
| 许可内容 | 同意山东寿光农村商业银行股份有限公司文庙街分理处终止营业 |
| 许可机关 | 潍坊银保监分局 |
| 审核类型 | 核准 |
| 数据来源 | 山东省 |
| 许可机关统一社会信用代码 | 12370000MB2839256B |
| 数据来源单位 | 潍坊银保监分局 |
| 数据来源单位统一社会信用代码 | 12370000MB2839256B |
### 表结构
| 字段名 | 字段类型 | 注释 | 默认值 | 能否可为空 |
| ----- | ----- | ----- | ----- | ----- |
| id | 数值 | 自增主键 | 自增 | 否 |
| company_name | 字符串 | 企业或自然人名称 | | 否 |
| company_name_digest | 字符串 | 主体唯一键 | | 否 |
| company_id | 字符串 | 主体唯一键 | MD5(company_name_digest) | 否 |
| credit_no | 字符串 | 统一信用代码 | | 是 |
| licence_number | 字符串 | 许可证号(行政许可决定书文号) | | 否 |
| licence_status | 字符串 | 许可状态 | | 是 |
| audit_ype | 字符串 | 审核类型/许可类型 | | 是 |
| legal_person_name | 字符串 | 法定代表人(负责人)姓名 | | 是 |
| legal_person_id | 字符串 | 法定代表人(负责人)id | | 是 |
| licence_content | 字符串 | 内容许可 | | 是 |
| validity_time | 字符串 | 许可有效期 | | 是 |
| decision_date | 日期 | 许可决定日期 | | 是 |
| allow_startdate | 日期 | 有效期自 | | 是 |
| end_date | 日期 | 许可截止日期 | | 是 |
| local_code | 字符串 | 地方编码 | | 是 |
| department | 字符串 | 许可机关 | | 是 |
| department_no | 字符串 | 许可机关统一社会信用代码 | | 是 |
| area_name | 字符串 | 区域 | | 是 |
| resume | 字符串 | 概要 | | 是 |
| licence_fliename | 字符串 | 行政许可决定文书名称 | | 是 |
| licence_name | 字符串 | 许可证书名称 | | 是 |
| licence_no | 字符串 | 许可编号 | | 是 |
| data_source | 字符串 | 数据来源 | | 是 |
| data_source_unit | 字符串 | 数据来源单位 | | 是 |
| data_source_unit_credit_no | 字符串 | 数据来源单位统一社会信用代码 | | 是 |
| use_flag | 数值 | 数据使用标记,0有效,10废弃 | 0 | 否 |
| is_history | 数值 | 是否历史[0:官网还存在 1:官网不存在] | 0 | 否 |
| create_time | 时间 | 创建时间 | 当前时间 | 否 |
| update_time | 时间 | 更新时间 | 当前时间且自动更新 | 否 |
### 字段加工
> company_name: 统一中英文括号
>
> company_name_digest: 优先用统一信用代码查询、查不到再用名称查询
>
> company_id: company_name_digest的MD5值
>
> local_code: 根据许可机关、数据来源、数据来源单位解析出的最深到区县一级的6位行政区划代码,不能到县一级,则存地市、否则省
>
> area_name: 省名称
>
> is_history: 信用中国不展示的行政许可将值设为1
### 记录去重
企业名称 + 行政许可决定书文号 作为唯一约束,即一个企业名称的一个行政许可决定书文号只能有一条记录
# 数据质量测试
1. company_name_digest都关联到值,且关联正确
2. company_id是company_name_digest的MD5值
3. 一个企业名称的一个行政许可决定书文号只能有一条记录
4. 日期字段日期格式正确,不能出现'0000-00-00'等
5. 测试企业的is_history=0的记录数据与网站展示的去重后记录数据一致(企业覆盖全、记录覆盖全)
6. 网站不展示的行政许可记录表中的is_history=1
7. 表中的字段值与网站展示对应,没有字段与字段值错乱
8. area_name的枚举值统一,不重复,比如:不能出现北京市、北京、bj、BJ、内蒙古、内蒙古自治区等多种描述
9. 不能为空的字段都有值
10. 字段清洗干净,字符串两边没有空格、换行符,页面没有值的字段表中不能是'— —'等
11. 许可决定日期、区域、地方编码 空值比例不能超过1%
12. 表中字段类型、默认值设置正确、查询字段设有索引
# 数据验收
验收通过要求:
* 上述数据质量测试通过
* 全量在营企业、事业单位、社会组织采集一遍
* 上述主体1个月滚动更新1轮次
* 数据使用说明、数据流转、程序部署、运行状态监控等相关文档完整
# 监控指标
1. 全量行政许可记录数
2. 涉及主体数
3. 每日更新记录数
4. 每日新增记录数
Clone repository
  • README
  • basic_guidelines
  • basic_guidelines
    • basic_guidelines
    • dev_guide
    • project_build
    • 开发流程
  • best_practice
  • best_practice
    • AlterTable
    • RDS
    • azkaban
    • create_table
    • design
    • elasticsearch
    • elasticsearch
      • ES运维
    • logstash
View All Pages