Skip to content

GitLab

  • Projects
  • Groups
  • Snippets
  • Help
    • Loading...
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
    • Contribute to GitLab
  • Sign in / Register
K
kb
  • Project overview
    • Project overview
    • Details
    • Activity
    • Releases
  • Repository
    • Repository
    • Files
    • Commits
    • Branches
    • Tags
    • Contributors
    • Graph
    • Compare
  • Issues 2
    • Issues 2
    • List
    • Boards
    • Labels
    • Service Desk
    • Milestones
  • Merge requests 0
    • Merge requests 0
  • Operations
    • Operations
    • Incidents
  • Analytics
    • Analytics
    • Repository
    • Value Stream
  • Wiki
    • Wiki
  • Members
    • Members
  • Activity
  • Graph
  • Create a new issue
  • Commits
  • Issue Boards
Collapse sidebar
  • granite
  • kb
  • Wiki
    • Lake
  • risk_own_tax

Last edited by 王 潘玉 May 17, 2022
Page history

risk_own_tax

欠税公告

存储信息

aliyun-mysql-rds
  • host: bdp-rds-001.mysql.rds.aliyuncs.com
  • port: 3306
  • user: **
  • password: **
  • database: utn_ng_risk

建表语句

CREATE TABLE `company_own_tax_info` (
  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
  `name` varchar(255) NOT NULL COMMENT '纳税人名称',
  `base` varchar(10) NOT NULL COMMENT '省市',
  `tax_id_number` varchar(150) NOT NULL COMMENT '纳税人识别号',
  `legalperson_name` varchar(150) DEFAULT NULL COMMENT '法人或负责人名称',
  `person_id_name` varchar(50) DEFAULT NULL COMMENT '法人证件名称',
  `person_id_number` varchar(150) DEFAULT NULL COMMENT '证件号码',
  `location` varchar(1000) DEFAULT NULL COMMENT '经营地点',
  `tax_category` varchar(255) DEFAULT NULL COMMENT '欠税税种',
  `own_tax_amount` varchar(50) DEFAULT NULL COMMENT '欠税金额',
  `taxpayer_type` varchar(10) DEFAULT NULL COMMENT '纳税人类型',
  `publish_date` date DEFAULT NULL COMMENT '发布日期',
  `own_tax_balance` varchar(20) DEFAULT NULL COMMENT '欠税余额',
  `new_own_tax_balance` varchar(20) DEFAULT NULL COMMENT '当前新发生欠税余额',
  `reg_type` varchar(50) DEFAULT NULL COMMENT '注册类型',
  `department` varchar(200) DEFAULT NULL COMMENT '税款所属税务机关',
  `source` varchar(500) DEFAULT NULL COMMENT '来源',
  `oss_location` varchar(100) DEFAULT NULL COMMENT 'oss上文件存放的位置',
  `type` smallint(6) DEFAULT NULL COMMENT '0国税 1地税',
  `create_time` datetime DEFAULT NULL COMMENT '创建时间',
  `update_time` datetime DEFAULT CURRENT_TIMESTAMP COMMENT '更新时间',
  `is_deleted` smallint(6) DEFAULT '0' COMMENT '是否删除 0否 1删',
  `company_name_digest` char(32) DEFAULT NULL COMMENT '对应主体唯一键',
  `company_id` char(32) DEFAULT NULL COMMENT '对应主体唯一键',
  PRIMARY KEY (`id`),
  UNIQUE KEY `index_id_number` (`tax_id_number`,`tax_category`,`publish_date`,`own_tax_balance`,`own_tax_amount`,`name`),
  KEY `index_name` (`name`),
  KEY `n_p_index` (`name`,`publish_date`),
  KEY `idx_digest` (`company_name_digest`)
) ENGINE=InnoDB AUTO_INCREMENT=4591256 DEFAULT CHARSET=utf8 COMMENT='欠税信息公告';

CREATE TABLE `company_own_tax_yhc`  (
  `rowkey` varchar(200)  NOT NULL,
  `company_id` varchar(200)  ,
  `company_name` varchar(200)  DEFAULT NULL,
  `base` varchar(10) NOT NULL COMMENT '省市',
  `tax_num` varchar(150) NOT NULL COMMENT '纳税人识别号',
  `legal_name` varchar(50) DEFAULT NULL COMMENT '法人证件名称',
  `legal_num` varchar(150) DEFAULT NULL COMMENT '证件号码',
  `location` varchar(1000)  DEFAULT NULL COMMENT '经营地点',
  `tax_category` varchar(255)  DEFAULT NULL COMMENT '欠税税种',
  `publish_date` date DEFAULT NULL COMMENT '发布日期',
  `new_tax_balance` varchar(20) DEFAULT NULL ,
  `tax_balance` varchar(20) DEFAULT NULL ,
  `department` varchar(200) DEFAULT NULL COMMENT '税款所属税务机关',
  `type` smallint(6) DEFAULT NULL COMMENT '0国税 1地税',
  `create_time_original` datetime(0) DEFAULT NULL COMMENT '创建时间',
  `update_time_original` timestamp(0) DEFAULT CURRENT_TIMESTAMP COMMENT '更新时间',
  `is_deleted` smallint(6) DEFAULT 0 COMMENT '是否删除 0否 1删',
  PRIMARY KEY (`rowkey`) USING BTREE,
  INDEX `index_name`(`company_name`) USING BTREE,
  INDEX `n_p_index`(`company_name`, `publish_date`) USING BTREE
) ENGINE = InnoDB AUTO_INCREMENT = 1 CHARACTER SET = utf8 COLLATE = utf8_general_ci COMMENT = '欠税信息公告' ROW_FORMAT = Compact;

CREATE TABLE `t_overduetaxs_qxb`  (
  `_id` varchar(50)   DEFAULT NULL COMMENT 'object_id',
  `md5_id` varchar(50)   DEFAULT NULL COMMENT 'md5值',
  `taxpayer_type` varchar(255)   DEFAULT NULL COMMENT '纳税人类型',
  `ename` varchar(255)   DEFAULT NULL COMMENT '企业名称',
  `pub_department` varchar(1000)   DEFAULT NULL COMMENT '公布单位名称/税款所属税务机关-pub_department属于爬虫爬的',
  `u_tags` varchar(10)   DEFAULT NULL COMMENT '是否隐藏',
  `oper_id_num` varchar(255)   DEFAULT NULL COMMENT '备用字段',
  `overdue_type` varchar(255)   DEFAULT NULL COMMENT '欠税税种',
  `history_overdue_amount` double(16,2) DEFAULT NULL COMMENT '以前年度陈欠余额',
  `area` varchar(1000)   DEFAULT NULL COMMENT '经营地点',
  `overdue_amount` double(16,2) DEFAULT 0 COMMENT '欠税余额/合计',
  `oper_name` varchar(255)   DEFAULT NULL COMMENT '负责人姓名',
  `taxpayer_num` varchar(255)   DEFAULT NULL COMMENT '纳税人识别号(北)/税务登记号(上海)',
  `reg_type` varchar(255)   DEFAULT NULL COMMENT '企业登记注册类型',
  `ops_flag` int(11) DEFAULT 8 COMMENT '标志位',
  `curr_overdue_amount` double(16,2) DEFAULT NULL COMMENT '当前新发生的欠税余额/本年度新欠余额',
  `qxb_type` varchar(1000)   DEFAULT NULL COMMENT '当前税务局的名称-type是代码写死的,就是当前爬的税务局',
  `file_path` varchar(1000)   DEFAULT NULL COMMENT '上传OSS之后的路径',
  `overdue_time` varchar(50)   DEFAULT NULL COMMENT '发生欠税的时间',
  `oper_id_type` varchar(255)   DEFAULT NULL COMMENT '证件类型',
  `pub_date` date DEFAULT NULL COMMENT '公布时间',
  `url` varchar(1000)   DEFAULT NULL COMMENT '数据来源',
  `tax_bureau` varchar(1000)   DEFAULT NULL COMMENT '(国家税务局、地方税务局)-tax_bureau是以前还分国税、地税的时候填的,现在不用了',
  `eid` varchar(50)   DEFAULT NULL COMMENT '企业id',
  `overdue_period` varchar(1000)   DEFAULT NULL COMMENT '欠税周期',
  `address` varchar(500)   DEFAULT NULL COMMENT '地址',
  `created_time` bigint(20) DEFAULT -1 COMMENT '创建时间',
  `last_updated_time` bigint(20) DEFAULT -1 COMMENT '最后更新时间',
  `row_update_time` datetime(0) DEFAULT CURRENT_TIMESTAMP COMMENT '数据库行更新时间',
  UNIQUE INDEX `index_id`(`_id`) USING BTREE,
  INDEX `index_row_update_time`(`row_update_time`) USING BTREE
) ENGINE = InnoDB CHARACTER SET = utf8mb4 ROW_FORMAT = Dynamic;

数据字典

表名 字段名 字段类型 注释
id bigint(20) 自增主键
name varchar(255) 纳税人名称
base varchar(10) 省市
tax_id_number varchar(150) 纳税人识别号
legalperson_name varchar(150) 法人或负责人名称
person_id_name varchar(50) 法人证件名称
person_id_number varchar(150) 证件号码
location varchar(1000) 经营地点
tax_category varchar(255) 欠税税种
own_tax_amount varchar(50) 欠税金额
taxpayer_type varchar(10) 纳税人类型
company_own_tax_info publish_date date 发布日期
欠税信息公告 own_tax_balance varchar(20) 欠税余额
new_own_tax_balance varchar(20) 当前新发生欠税余额
reg_type varchar(50) 注册类型
department varchar(200) 税款所属税务机关
source varchar(500) 来源
oss_location varchar(100) oss上文件存放的位置
type smallint(6) 0国税1地税
create_time datetime 创建时间
update_time datetime 更新时间
is_deleted smallint(6) 是否删除0否1删
company_name_digest char(32) 对应主体唯一键
company_id char(32) 对应主体唯一键

样例

id name base tax_id_number legalperson_name person_id_name person_id_number location tax_category own_tax_amount taxpayer_type publish_date own_tax_balance new_own_tax_balance reg_type department source oss_location type create_time update_time is_deleted company_name_digest company_id
4591255 上海苏蝶实业有限公司 sh 91310120785893426A 徐丹 居民身份证 非公示项 上海市奉贤区南桥镇新建西路101号 城市维护建设税 2020-07-27 10.51 第十一税务所 http://shanghai.chinatax.gov.cn/fxtax/tzgg/qsgg/202007/t454696.html taxNotice/shanghai.chinatax.gov.cn+++20200727P020200727340607193984.xlsx 2020-07-29 00:00:00 2020-07-29 00:00:00 0 5d284cc440a4ed1e6ff2c1e29bdfd74a 13b2ba20d8ca71d684e39983d5f7f264
4591254 上海苏蝶实业有限公司 sh 91310120785893426A 徐丹 居民身份证 非公示项 上海市奉贤区南桥镇新建西路101号 增值税 2020-07-27 1050.70 第十一税务所 http://shanghai.chinatax.gov.cn/fxtax/tzgg/qsgg/202007/t454696.html taxNotice/shanghai.chinatax.gov.cn+++20200727P020200727340607193984.xlsx 2020-07-29 00:00:00 2020-07-29 00:00:00 0 5d284cc440a4ed1e6ff2c1e29bdfd74a 13b2ba20d8ca71d684e39983d5f7f264
4591253 上海嵩川包装材料经营部 sh 9131012009384069XX 姜春莲 居民身份证 非公示项 上海市奉贤区奉城镇奉高路999号7号厂房 城市维护建设税 2020-07-27 733.03 第十一税务所 http://shanghai.chinatax.gov.cn/fxtax/tzgg/qsgg/202007/t454696.html taxNotice/shanghai.chinatax.gov.cn+++20200727P020200727340607193984.xlsx 2020-07-29 00:00:00 2020-07-29 00:00:00 0 d9e50e8c8d0a771e2212428afe4ae6ae 1600f020232128b8e4e0c04ae9eb8b11
4591252 上海嵩川包装材料经营部 sh 9131012009384069XX 姜春莲 居民身份证 非公示项 上海市奉贤区奉城镇奉高路999号7号厂房 增值税 2020-07-27 73302.89 第十一税务所 http://shanghai.chinatax.gov.cn/fxtax/tzgg/qsgg/202007/t454696.html taxNotice/shanghai.chinatax.gov.cn+++20200727P020200727340607193984.xlsx 2020-07-29 00:00:00 2020-07-29 00:00:00 0 d9e50e8c8d0a771e2212428afe4ae6ae 1600f020232128b8e4e0c04ae9eb8b11

说明

  • is_deleted字段的值包括:0、1、2等,查询欠税公告条件为 is_deleted=0,历史欠税公告: is_deleted != 0
Clone repository
  • README
  • basic_guidelines
  • basic_guidelines
    • basic_guidelines
    • dev_guide
    • project_build
    • 开发流程
  • best_practice
  • best_practice
    • AlterTable
    • RDS
    • azkaban
    • create_table
    • design
    • elasticsearch
    • elasticsearch
      • ES运维
    • logstash
View All Pages