命名实体识别数据预处理(和CFA小白聊聊金融常识(二))

卓岚 13 2024-12-14 03:15:19

背景:从提供的金融文本中识别出未出现的未知金融实体

一、简单的熟悉数据

使用数据:

部分数据如下:

二、清理数据

(1)找出所有的非中文、非英文、非数字符号

(2)一些要保留的符号

(3)找出他们之间的差异

(4)过滤掉一些停止词其噪声

(5)对数据进行处理:我们将title和text的数据一起考虑

可视化train_df:

三、探索数据

(1) 原始数据中可能存在一些错误的标签我们需要将其找出来

(2)修复错误标签

(3)将处理后的数据重新存储

(4)看一下句子长度的分布

重新加载初步处理好的数据:

统计一下每个区间的长度的个数:

看下总体描述:

最大长度是32212,最小长度是4,75%的数据长度在1357以下。

句子还是比较长的,我们需进分句处理:

删除掉为Unname的那一列:

同样的我们要对测试集也进行相应的划分,这里的测试集是没有标签的:

五折划分数据(可选)

验证切分是否正确:

四、保存数据

参考:https://github.com/ChileWang0228/Deep-Learning-With-Python/

继上次和大家聊聊聊金融常识之后,各位考生小伙伴纷纷表示非常喜欢这个必备常识,废话不多说,小编再次为大家奉上CFA小白必备金融常识第二集!速看速收藏哦!

和CFA小白聊聊金融常识(二)

一、货币

1. 加息会使市场利率上升,贷款积极性下降,市场上钱变少了,会抑制投资和通货膨胀。

降息使市场利率下降,市场钱变多,从而促进投资和经济发展,不过也可能导致经济过热。

2. 存款准备金率就是我们存在银行的钱,银行要再向央行上缴的比率。上调准备金率,银行存在央行的钱增加,市场上流通的钱越少,资金面变紧缩。

反之,下调准备金率,存在央行这的钱越少,市场上流通的钱越多,资金面变宽松。比如今年一月份央行就宣布降准1%,预计释放1.5万亿货币。

3. 再贴现率就是商业银行向央行借钱的利率,提高再贴现率,商业银行资金成本提高,放款积极性下降,货币政策紧缩。下调再贴现率,商业银行资金成本下降,放款积极性提升,货币政策宽松。

4. PMI是采购经理指数,是GDP的先行指标,当PMI低于50%,经济同比上期呈收缩趋势,当PMI高于50%,经济同比上期呈扩张趋势。

5. 任何国家央行的印钞都需要抵押物,否则没有国家会敢和你做生意。美国的主要抵押物是美国国债,中国的主要抵押物是外汇资产,以美国国债和美元为主。

如果汇率持续下跌,更多人会将人民币兑换成美元,从而会加剧外汇资产的流失,而外汇资产又是央行印钞的核心抵押物之一,这无疑会影响到我们的货币供应。因此我们要实行外汇管制,限制人民币和美元之间的自由兑换。

二、投资

1.72法则

72/你的投资年化收益=本金翻倍的时间比如你的投资年化收益率为9%,那么本金翻倍的时间大概是8年。

2.利率陷阱

分期费率≠实际利率

举个例子,分12期,月手续费率0.6%,年手续费率7.2%的一个借款,它的实际利率约为13.03%。不会算没关系,大致记住,分期费率的利率是账面利率两倍左右就好。

3. 通货膨胀的利弊

实际回报率=名义回报率-通货膨胀率假如你的投资收益率是8%,而全年通货膨胀率是7%,不要暗喜,你全年的实际回报率也只有1%而已。要想跑赢通胀是很难的,但什么不做更可怕,资产会被通胀稀释的一文不值。如果按5%通胀率持续30年,同样币值只值原先的1/5。所以投资理财,不说为了资产倍增,最起码先跑赢通胀。同理,如果通货膨胀率是7%,但是银行的借贷利率只有5%,那么借钱消费就赚了。

4. 套现与杠杆

上市公司市盈率如果是20倍,上市后卖出股票(增发),相当于可以把未来20年的利润提前进行变现。市值变现之后,再用其中一部分的资金用于其他未上市公司的并购,再增加1倍的利润。市盈率不变的前提下,又能获得翻倍的市值,继续变现收购,实现正循环。

人本身也是20倍左右的市盈率,在你投保寿险的时候,如果保额是200万,健康告知会问及你的收入是否大于10万,这要求的就是收入与身价的匹配。所以年收入乘以20,大致就是自己的身价,提高收入的重要性不言而喻。大部人快速提高收入的途径,都是通过开立公司,以较低的成本收购别人的单位产能。

三、基金

1.根据数据回测,公募基金未来的业绩与其历史业绩并无太大关联,所以不要被基金华丽历史业绩蒙骗了。

2.基金分红只是左口袋倒右口袋的把戏,妄图在分红前买入能赚一笔的人都是傻子。

3.长期来看,上涨确定性最大的权益类基金是指数基金。

4.降息利好债基,加息利空债基。

5.货币基金的收益和银行的资金面有关,货基收益走低,说明银行手头上有钱。

6.分级B是杠杆基金,不懂不要碰,可以玩的你倾家荡产。

四、保险

1.同样保障内容,互联网保险的价格一般比线下便宜保险20%-30%。

2.不要买终身寿险,除非你是身家过亿的富豪。

3.健康告知不要有隐瞒,不要抱侥幸心理,否则到时候理赔起来被查到很麻烦。

4.先给家人买好保险,再考虑去做体检的事情,否则反过来可能就买不了保险了。

5.保50种重大疾病和保100种重大疾病的理赔率相差无几,所以不要太迷信这个。

6.一份齐全的保障成年人保障计划是“重疾险+医疗险+寿险+意外险”,年金险是可有可无的。

7.不要碰综合偿付率太低的保险公司,因为可能还没理赔前这家公司就倒闭了,只有寿险,是保险公司倒闭,一定会被接管的。

五、理财

1.工资是主动收入,而投资带来的回报为被动收入,被动收入占总收入比重决定了你的财务自由度。

你可以通过购买商铺进行出租,投资每年有稳定分红的企业股权,或者通过买入一些稳定的理财来增加你的被动收入,当被动收入>>你的日常支出的时候,这意味着你在某种程度上已经实现了财务自由。

2.家庭资产负债表是一个很有用的东西,现金、货基、存款等活期类理财至少要达到家庭支出3-6个月以上,否则家庭财务非常容易因为突发事件出现危机。

3.保险支出达到家庭收入15-20%完全是保险业务员为了业绩编造的谎言,如果你把钱都花在合理,必要的保险上面,每年保费支出占比在家庭收入5-10%就完全足够了。

4.信用卡最长可以达到87天免息期,具体操作方法为在账单日次日刷卡,那么出账单前就有30天,然后再在账单日前一天致电银行修改账单日,时间改成账单日的前两天,然后又有29天才出账单,账单出来之后还有25天免息期,到了还款日之后还有3天还款宽限期,加起来可以达到87天。(注意:极个别银行不支持修改账单日或需要还请信用卡才能修改)

5.信用卡背后都是你的移动贷款库,一般人都能从信用卡所属银行贷出信用卡额度的2-3倍的资金,虽然利率可能比较高,但大多是随借随还,甚至比借呗还要便宜。

6.公积金存款利率很低,只有1%左右,每个人账户上基本都有几万十万,如果短期不买房,把它提取出来买5%的银行理财也是稳赚的,提取方法有很多种,比如买房可以一次性提取、租房可以分期提取、离职、以及房屋装修等也可以一次性提取,具体看当地政策。

7.如果任职公司,那么有公司和自己一起缴纳养老社保,绝对是一件划算的事情,但是如果是灵活就业人员自己缴纳养老社保,则是一笔风险投资,因为如果活得不够长提前身故了,统筹账户的钱是充公无法返还的,我测算了一下,这个“盈亏平衡”的年龄在72岁左右。

8.去银行办信用贷款,标准各不相同,但差异不大,以某行为例,风控要求是:两年内累计逾期不超过5次,两年内单笔贷款逾期不超3个月,半年内征信查询不超过12次。注意申请借呗和微粒贷都是要查征信的。

六、社保

1.自由职业者想给自己交五险,如果是当地户口,自己给自己开个账户交社保,不要公司,因为失业、生育和工伤都用不着,而且养老要交28%,自己交只要20%,纯粹浪费钱。

2.工伤险里面职业病也算!自己琢磨下怎么去报销。

3.生育险交满1年就可以领高额生育津贴且报销生育费用,如果自由职业者有生孩子的计划,最好找个单位交满1年生育险。

4.自己交养老保险有风险,提前身故甚至本金都拿不回,按照60岁退休男性的话,我计算了一下,活到75岁左右才可以拿回本金。

5.大部分城市医保不仅可以报销住院,还可以报销门诊,这个免赔额一般是每年累计1000多,超过这个数字你会发现80%以上费用都可以报销了(保额内)。

6.公积金公司给你交的比例(上限12%)越高越好,不仅因为可以贷款买房,而且多出来可以提取出来买理财。

哇哦~怎么样,虽然有点多,但是都是大家备考所需的金融常识哦!多了解,才更有充足的底气上考场!努力了的才叫梦想,不努力的就是空想,你所付出的努力,都是这辈子最清晰的时光。

扫码加入正保金融大讲堂,关注并回复"思维导图"领取正保会计网校专属资料!同时还有相关的考试资讯以及报考福利,赶紧来关注吧~

和CFA小白聊聊金融常识(二)

扫码回复“思维导图”领取资料

更多推荐:

2021年CFA《财报》科目【思维导图十一】

2021年CFA《财报》科目【思维导图十二】

上一篇:【践悟方法论】推进健康中国建设
下一篇:梅西又要来中国了!3月,阿根廷国家队将在杭州、北京迎战尼日利亚、科特迪瓦
相关文章
返回顶部小火箭