“你大爷的,我就客套一下说帮忙做点事,你也不能把我当牲口来用吧?”
胡宪安看着这堆资料,下意识地咽了一下口水。
江飞宇宽慰道:“安拉,这些资料别看很多,其实百分之80以上都是重复的数据,很多可以快速跳过的,而且我也没限定你时间,你什么时候完成都行!做不完也不要紧,能做多少算多少。”
“这还差不多。”
为了长期饭票,胡宪安只能无奈接受了“卖身为奴”的事实。
达芬奇不是说嘛,数学是一切科学的基础。
像这种规律性的东西,最终还是要回归底层的数学来解决。
而且,胡宪安学的就是数学相关专业,从数据里面分析出规律是他的看家本领。
别看胡宪安的专业课成绩一般,那是因为他懒得去背那些“填鸭式”的答案,但却不代表他不懂计算原理。
江飞宇不就是个很好的例子嘛!
上机操作能力一流,基础理论知识,不说也罢。
胡宪安拿起一沓资料随手番了一下,问道:“即使我这样的商业小白也知道,这堆资料应该涉及你们公司的核心商业机密了,你就这么放心让我这个外人接触?”
江飞宇自信道:“以我对你的了解,地上有一沓钱你也懒得捡。”
胡宪安来了兴致,问道:“何以见得呢?毕竟弯腰伸一下手就能不劳而获,一般人应该不会拒绝吧!”
江飞宇解释道:“因为你考虑的因素太多了,比如:是不是有人故意下套?就等你捡的瞬间跳出来人赃并获......钱要怎么还给失主?在现场等?还是交给警察?失主会不会污蔑你黑了一部分财物......”
“无论怎么看,捡起来都会带来一大堆麻烦,这不符合你的性格。最关键的是你不缺那点钱,为了一点钱招惹麻烦,对你来说就是不智。所以,一般人的经验套用在你身上就不合适。”
更深层的原因是,飞信平台的核心竞争对手只有一个,那就是鹅厂。
双方竞争了这么久,都是知根知底的。
对于竞争对手的运营数据,也有一个相对准确的估算,误差率不会超过百分之15。
就算胡宪安把这份运营数据卖给鹅厂,也卖不出多少钱。
这才是江飞宇丝毫不担心胡宪安会泄露出去的原因。
又被猜透了,胡宪安无奈道:“说吧,你需要我从这堆资料里面找什么规律?”
江飞宇解释道:“我们公司的计算资源采用了有别于同行的分布式架构,这是一种灵活的分布式存储和运算模式......通俗来说就是一种按需分配计算资源的模式......”
“所以,我现在需要你帮我从原始的运营数据中找出规律,识别出什么日期、时间段、事件会影响计算资源的需求量,以便达到精准运营的管理目标......”
江飞宇这样一说,胡宪安就懂了。
如果说,飞宇科技拥有的计算资源总量是100个单位,飞信平台的平均资源需求是15个单位。
但是,你不可能完全按照15个单位来分配资源。
因为,周末、晚上8点这种黄金时间段,用户的在线率会大幅度增长,需要的计算资源可能会飙升到20以上。
这种情况下,运维部每次都需要预留大部分计算资源给这些黄金段时间。
但是,这种预留资源是一种很粗的预估,往往造成很多的资源闲置。
比如,当值的运维主管凭借个人经验,申请今晚预留27个单位资源。
可实际上,当晚可能只用了22个单位,这样就会有5个单位的资源浪费。
而江飞宇现在想要做的,就是想实现精准预估。
不求非常精准预估,但是至少也要把原来27个单位的预估值,压缩到24个单位左右。
这样,就可以节省3个单位的资源。
这些节省的资源就能用于其他方面,为企业创造出更多的价值。
原理是摸清楚了,但是这个工作还是非常繁琐的。
因为,胡宪安要把过去一年每一天的事件因素都要考虑进来。
举个例子,比如去年6月份内相近的两个周末时间段,数据诧异就非常的大。
工作人员回溯后发现,因为后面一个周末,人们都去看世界杯决赛了。
所以,上网的人就少了。
这也导致了,胡宪安要考虑的因素非常多。
江飞宇想让他做的,就是尽可能地把这些影响用户在线量的因素识别出来,并进行归类。
识别这些影响因素,只能说是第一步。
第二步,还要建立一套科学的计算体系,识别每一类因素对用户在线量的影响率是多少。
第三步,就是把第一、第二步的成果用代码来实现,也就是开发出一套预测分析系统。
以后就不用人工去算了,输入影响的变量,系统就能给你计算出来。
当然了,要弄出这个东西还为时过早。
特别是第二步,这个计算体系光是论证估计就得大半年,还要加上大量的真实数据进行计算修正。