《推荐系统学习》之推荐系统那点事

  • 时间:
  • 浏览:1

  2、学院派的【算法工程师】往往是为了算法而算法,而还会 为了补救推荐系统的问题报告 报告 去找最适合算法。这也是为那些大公司总是 招了许多博士毕业的算法工程师后,还会 研究算法也不让许多人整天在那看数据报表?【否则发现算法没啥好研究,只有让许多人在那看看报表找找规律了。】

  殊不知,我我觉得这另一两个例子和所谓的【算法】我我觉得关系不大。

  首先,在推荐中,醒目的推荐位应该是【热门推荐】否则【人工推荐】,【人工推荐】是指比如在体育新闻中,巴萨夺冠相似的大新闻是直接让编辑来【人工推荐】即可,也不此新闻一出,马上登上头条,而还会 在那磨磨唧唧的计算特性值,计算相似度,计是是不是否符合用户兴趣。 对于推荐中的【冷启动】,最理想的推荐也不【相关推荐】。说到这里,整个推荐系统的 100% 否则搭建完毕,【热门推荐+人工推荐+相关推荐】,这三者还会 【个性化】都没那些关系,也算法关系也不大,否则这三者效果的好坏就决定了整个系统推荐效果好坏的 100% 。好多人连最基本的这三者都找不到 做好,就结速了了想一步登天,很可惜,原来的捷径是不趋于稳定的。 接下来是 20% 的【个性化】的做法,如上所说,个性化是为了补救【长尾】问题报告 报告 ,正是是不是则长尾占商品的 20% ,什么都有在此我认为【个性化】我我觉得也只有 20% 。要补救个性化,首先也不要对用户分析,最成熟图片 图片 的句子的句子期期期 图片 期的句子图片 期的句子的最好的辦法 也不对用户打标签(是是不是我就想起来社交网络为那些总是 我就选取至少的标签描述许多人,没错,也不为了分析你)。

  首先是【啤酒和尿布】,超市的人员发现买啤酒的男人的女人容易顺手买尿布。这我我觉得是三种数据分析,是根据数据统计去掉 人工分析得出,是三种以经验来改善销售的行为。和【机器学习】【数据挖掘】等算法的关系不大。 刚接触【推荐系统】的日后,【协同过滤算法】大热, 我也原来迷恋得研究过该算法,以为发现了那些宝贝一样。否则实际上,在工程中【协同过滤】出来的效果往往惨不忍睹,所谓的【算法工程师】每天能做的也不在那调整【协同过滤】算法的相关参数,否则看看第4天 的点击率有找不到 上升。否则调整到最后我就发现,牛逼哄哄的【协同过滤】我我觉得还不如简简单单的【看多又看】效果来的好,我我觉得协同过滤算法本质上也是三种【看多又看】的思想。

  2. 亚马逊的推荐系统

  4、当另一两个做推荐系统的部门结速了了重视【数据清理,数据标柱,效果评测,数据统计,数据分析】那些所谓的脏活累活,原来的推荐系统才会有救。

  3、【几乎所有所谓的智能推荐算法还会 花拳绣腿】

  我我觉得,给用户打标签,逼格更高的说法叫【用户特性提取】否则【用户行为分析】。说到这另一两个词,那些所谓的算法工程师否则就会结速了了扯那些高大上的算法,机器学习,自然语言补救,数据挖掘等各种算法。其我我觉得我看来,算法很大情况根本派不上用场,我认为这方面的关键在于【数据统计 + 人工分析】。将用户的浏览记录等记录下来,统计他最常点击的东西,最常去的频道,否则给他打上那些频道否则商品的标签。否则分发更完整篇 的信息,比如年龄,打上【青少年,男人的女人,男人的女人的女人,老人】等标签,根据那些标签进行推荐。比如当推荐防衰老的商品时,就都需用偏向于男人的女人的女人,推荐运动产品时,就都需用偏向于男人的女人和青少年,推荐保健品时,就都需用偏向于老年人。什么都有,光看年龄三种标签的维度,就都需用做什么都有文章。什么都有标签库的设计和积累,是非常广泛和重要的,而这方面需用极少量依赖于【人工分析】,而还会 看论文调算法能做到的。 就好比现在的中文分词,拼到最后许多人还会 比词库的积累,谁的词库好,谁的效果就好,【搜狗】的【拼音输入法】效果好也是是不是则词库比别人好。



  那年还否则买了一本项亮的书《推荐系统实践》,那本书和现在的什么都有热门书籍一样,还会 跟着概念热起来的。 我我觉得有许多作者许多人的实战经验在里边,否则总体上来说并找不到 太满值得重复翻开的地方。

  1、实力派的【算法工程师】往往还会 ABC[always be coding],原来的算法工程师不能根据实际问题报告 报告 建立模型否则建立规则库,是真正能补救问题报告 报告 的人。往往是许多有研究背景,经验充沛的研究员,更加重视工程,否则工程架构上许多恰当合理的设计,效果往往就能远远高过于模型算法优化。

  几乎所有宣扬【推荐系统】的人,还会 拿【啤酒和尿布】,【亚马逊推荐占营收20%】相似的经典例子来说力证推荐系统的牛逼之处。到处宣扬【推荐系统】插上【机器学习】等算法的翅膀,就能让电子商务变得精准无比,能智能的猜出用户想买的东西。

  不管是电商,否则是新闻,还会 【个性化推荐】和【热门推荐】的选取。另一两个商品热门否则点击量高是有其导致 的。什么都有将热门的东西推荐给用户是非常合情合理的,否则既然热门,也侧面说明了很至少率上该用户也会喜欢该商品。而【个性化推荐】本质上是为了补救【长尾】问题报告 报告 ,把那些不热门的东西,否则很否则符合某特定用户品味的商品【挖掘】出来,推荐给特定的用户群。

  第一次接触【推荐系统】是在两年前在某高校的互联网信息补救实验室的日后,那日后,【机器学习】和【大数据】还会 新概念,否则差太满5天 后,【大数据】的概念就结速了了风靡全球了,到现在否则被爆炒得面目全非。

  1. 啤酒和尿布

  当然不都需用定的是亚马逊的推荐系统应该是很牛逼的,否则这从不说明许多人采用的【推荐算法】非常牛逼。推荐系统我认为我我觉得和搜索系统并无太满差异,我总是 认为推荐系统我我觉得也不另一两个个性化的搜索引擎。日后在【秘密】上很火的有个爆料是:“3100搜索的Rank刚结速了了也不用【机器学习】的算法去做,屎一样的效果,是我把百度的基于规则的算法偷过去日后才变好的。” ,三种爆料出来不少人讽刺【基于规则】,我我觉得这是在黑百度的算法。 我我觉得还会 原来的,记得当时阿里搜索挖了另一两个谷歌搜索的员工,所许多人 在阿里分享的日后也不过:【谷歌的搜索效果比别人好的导致 也不规则库牛逼,关于算法使用的还会 成熟图片 图片 的句子的句子期期期 图片 期的句子图片 期的句子的人尽皆知的算法,并没那些新奇酷的算法】。 否则也是三种导致 ,谷歌研究院的科学家几乎还会 【工程师背景】出身的。还记得上次【CCF推荐系统前言讲座】,刚结速了了叫了十几个 学院派的讲师在那大讲特讲各种酷炫掉渣天的算法,否则淘宝的大数据负责人车品觉 上台日后直接来了句【许多人实验出各种算法效果不太好,还不如最基本的 关联规则 效果来的好】直接把前面的学院派专家们打脸打得都肿了。

  亚马逊的推荐系统占了营收比,我记得是20%,谁能谁能告诉我现在上升了还是下降了。三种说辞会让什么都许多人误以为只要你搞好了推荐系统,你的营收就能上升20%以上一样。我我觉得不然,对于亚马逊来说,为那些推荐能起到找不到 高的销量,另一两个很重要的导致 在于,【亚马逊的首页点击率高的部分位置划分给了推荐系统的】,从广告学上讲,广告位置的好坏极大的决定了广告的销量。三种很容易理解,假设你的产品的广告牌能挂上天安门城楼句子,你我我觉得你还需用担心该产品的销量吗?

  最后也不根据标签的定向推荐,三种推荐概率是有【权重设置】在里边,就比如刚才对年龄三种维度的权重,是需用给予对应的权重值,咋样给定呢?我我觉得也不【拍脑袋】,当然,否则有许多公司否则得出经验值了直接都需用拿来用就会更好。否则在拍完脑袋日后需用做的也不观察点击率变化,查Bad Case,否则再对权重进行调整,也也不根据评测和反馈来调整,找不到 【评测和反馈】,整个系统等于是另一两个黑盒,谈何优化?在我看来,【推荐系统】本质上首先是另一两个系统,需用不断的对各种效果进行【评测】,查各种【Bad Case】,而那些都还会 看论文都需用学到的东西。

  回想起来,我也是是不是国内接触推荐系统较早的人之一了,最近和人聊天,我我觉得不少人对推荐系统有所误解,以为需用多么高大上的算法不能搭建起来的,我只想说我总是 说的那句话【还会 原来的】,什么都有有了这篇文章。