10大优享服务
62项会员特权
5000-10000
招标
脚本开发
收藏
保险产品PDF费率表解析成excel
距选标截止:
需求描述:

这件事情的背景

我们是一家AI创业公司,致力于让AI理解国内所有保险产品,结合用户自身的诉求,为用户提供养老规划、理财规划、教育规划。

需要你做什么

我们需要将每一款保险产品的费率表现价表解析成我们指定的格式,从而方便后面AI系统进行统一的数据分析。但由于保险公司提供的费率表现价表结构都不一样,所以就需要你写程序将原始的费率表现价表转换成我们指定的结构。

举个例子 - 费率表如何解析

保险公司提供的费率表长这样,并且都是PDF格式:

现在需要你写一个程序将PDF中的数据提取出来,并且按照如下结构存储成一份excel文件:

产出的这份excel文件包含如下几个字段:

  • age:投保年龄

  • sex:性别(是一个枚举,男用MALE表示,女用FEMALE表示)

  • insurance_period:保障期限,也就是这个保险产品能提供多久的保障,有两种表达方式,如果是以Y结尾,表示保障多少年,如果是以A结尾,表示保障至多少岁。注意:如果产品名字中有“终身”字样,说明这款产品是保障终身的,那么这个字段直接填999Y即可。

  • pay_frequency:交费频率,它是个枚举,枚举值如下

    • ONCE:一次性缴费(保险专业术语交“趸交”)

    • BY_YEAR:按年分期交费

  • pay_period:交费期限,也就是交多久,它也有两种表示方式:

    • 1Y:以Y结尾,表示交多少年

    • 70A:以A结尾,表示交到多少岁

  • amount:就是费率表中对应的数字值,也就是当前选项下对应的保费金额。

    • 注意:最终excel存储的amount单位是分,但费率表中的单位可能是元,需要做元->分的转化。


再举个例子 - 现价表如何解析

原始的现价表长这样:


现在需要将它转换成如下格式:

现价表的最终转换的结构其实和费率表类似,只不过多了一列:policy_year(保单年度)


交付流程是怎样的

如果决定开始,你将收到保险产品的压缩包,每个产品一个文件夹,每个文件夹下面分别会有费率表现价表两个PDF文件(说明书和条款请忽略),如下图所示:


收到这份产品清单后,你就可以开始按照上文所说的结构将PDF解析成我们指定结构的excel。

解析后的文件分别命名成费率表.excel现价表.excel放在每款产品各自的目录下即可,就像下图所示:


如何结算

每一批次任务完成后,我们将会对生成的费率表.excel现价表.excel执行测试用例,一般会有50条测试用例,通过测试验收的excel文件将按照每个excel文档5元的价格支付。

没通过测试用例验收的excel,修改过后重新提交,提交通过后依然会按照每个excel 5元的价格支付。

时效要求

前两周没有时效要求,可以熟悉流程、了解数据结构。

两周之后需要保证每周至少完成50个产品的解析(一个产品同时包含一张费率表和一张现价表)。

登录查看详细需求描述
任务流程:

雇主

发布需求

威客

报名竞价

雇主

选择中标

雇主

托管赏金

威客

在线工作

雇主

验收付款

任务进行中

一品威客网已聚集超千万专业人才,为雇主提供一站式优质服务

已交稿
2
收到稿件数