• 项目
首页>>文章列表 >>行业研究
行业研究

AI芯片架构的争论真有意义吗? 2017-06-07 14:33:36

做了这么多年芯片,像AI芯片这样备受关注的情况还是第一次看到。这段时间随着Volta和TPU2的发布,“GPU好还是TPU好”的争论又热了起来,也有很多断言性的结论。这样的争论真的有意义吗?


我们先看一张图,它来自RIT的Shaaban教授的计算机体系结构课程,比较各种computing elements。其中,他把GPU,DSP归为ASP,TPU大概的位置是Co-processor这一类。FPGA则是一种Configurable Hardware。

实际上,今天大家吵的厉害的CPU,GPU,DSP,TPU(第一代采用脉动阵列架构),FPGA这些架构并不新鲜,都是体系结构领域研究多年的内容。除了GPP(General Purpose Processors,通用处理器,或者我们一般意义上说的CPU),这些架构的发明,往往是针对特定应用或者特殊目标的。从这些架构在图中的分布可以看出,每个架构都是Trade-off的结果,Computational Efficiency的提高是以牺牲Programmability/Flexibility为代价的。


具体到AI应用,是不是可以说TPU就比GPU好,或者反之呢?

我们不妨再来看另一张图,它来自International Business Strategies, Inc. (IBS)2014年发布的报告 "Strategies in Optimizing Market Positions for Semiconductor Vendors Based on IP Leverage"。它说明的是在主流的芯片设计中,随着工艺节点的演进,设计成本变化的趋势和分布(不包括生产成本)。


AI芯片架构的争论真有意义吗?

从这里不难看出,我们在一个芯片项目中各个任务需要的投入(cost)。显然,其中最大的部分是Software,Verification和Validation。而Architecture设计只占其中的很小一部分。这个比例和目前大多数芯片厂商的人员配置也是基本相符的。形成这种趋势,是因为现在的芯片往往只是一个复杂系统中的一部分。芯片设计厂商(或者方案商)提供给客户的已经远远不止芯片本身,而是一套完整的软硬件解决方案。Nvidia在Deep learning上的巨大成功,是归功于它的芯片底层硬件架构,还是它完善的软硬件生态呢?当然是后者。Google之所以敢于和能够自己设计TPU芯片,是和Tensorflow布局和以及data center方面的经验分不开的。绝大多数deep learning用户看到的是Tensorflow(或者其它训练框架)和CUDA,而不是底层硬件(只要硬件别太昂贵)。


由于目前的计算系统,比如说Deep Learning的系统,是一个相当复杂的软硬件系统。要公平的对比不同的芯片硬件架构反映到最终应用层面上的优劣,是一件非常困难的事情。从不同的角度或者立场出发,大家可能会看到完全不同的结果。此处想起前段时间的段子,“拳击跟太极谈实战,太极跟拳击谈历史;空手道跟太极谈实战,太极跟空手道谈武德;柔术跟太极谈实战,太极跟柔术谈观赏;泰拳跟太极谈实战,太极跟泰拳谈养生;瑜伽跟太极谈养生,太极‘来,我们谈谈实战。’ ”真不是黑太极,不过如果大家可以直接“对战”,也就没有打嘴仗的必要了。


决定我们的AI芯片是否成功的因素到底是什么?仅仅是因为你选择了Nvidia GPU采用的硬件架构或者是Google TPU的脉动阵列架构吗?还是你发明了一种新的架构?当然不是。架构的选择和设计应该服务于整个系统和项目,需要对很多因素做Trade-off和Optimiztion。从技术角度来看,如果把一个芯片应用分成,算法/软件,硬件架构,电路实现,几个从高到低的基本层次。那么高层次上的优化,对于整个系统的效果往往比低层次高一个数量级。(当然,这是个一般经验,针对不同类型的项目会有一定差异)很多时候,这种Trade-off甚至都不是技术本身的问题。比如,Google在芯片设计上的实力和Nvidia相比相差很远,从硬件相对简单的脉动阵列做起就是个比较自然的选择。而在Google TPU的论文里也明确提到,由于项目时间比较紧,很多优化也只能放弃(Google TPU 揭密)。


“Under The Hood Of Google’s TPU2 Machine Learning Clusters”,这篇文章对Google TPU2现有的信息做了非常深入的分析,作者从Google提供的仅有的几张照片中发掘出大量信息(建议大家点击本文最后的查看原文好好看看)。其中有这样的描述:

“This tight coupling of TPU2 accelerators to processors is much different than the 4:1 to 6:1 ratios typical for GPU accelerators in deep learning training tasks. The low 2:1 ratio suggests that Google kept the design philosophy used in the original TPU: “the TPU is closer in spirit to an FPU (floating-point unit) coprocessor than it is to a GPU.” The processor is still doing a lot of work in Google’s TPU2 architecture, but it is offloading all its matrix math to the TPU2.”


也就是说TPU2和GPU相比,它更像是coprocessor,需要更多的依赖CPU这样的通用处理器。这也是Google的Trade-off之一。从这篇文章还可以看出,Goolge在Data center领域的经验,让它可以用很多板级设计和系统级设计优化来弥补芯片设计能力的欠缺。


另一方面,硬件架构是取得竞争优势的门槛吗?

还是那句话,体系结构的研究已经很成熟了,创新很难,想做别人做不了的东西基本不可能。Nvidia最新的GPU中,增加了Tensor Core(Nvidia Volta - 架构看点),而在面向自动驾驶的Xavier SoC中,设计了专门的硬件加速器DLA(Deep Learning Accelerator)(从Nvidia开源深度学习加速器说起)。Google TPU2中为了同时实现training(第一代TPU只支持inference),增加了对浮点数的支持。虽然目前看不到细节,但可以猜想它的架构也相对第一代TPU的简单的脉动阵列(脉动阵列 - 因Google TPU获得新生)做了很大改进。可以看出,在口水战的同时,他们也在相互借鉴对方的优势。而对于一个成熟团队来说,硬件架构上的改进并不是很大的困难。更大的风险在于硬件架构的改动对软硬件生态的影响(又是一个trad-off)。


“Under The Hood Of Google’s TPU2 Machine Learning Clusters”,这篇文章最后这样说:

“There is not enough information yet about Google’s TPU2 stamp behavior to reliably compare it to merchant accelerator products like Nvidia’s new “Volta” generation. The architectures are simply too different to compare without benchmarking both architectures on the same task. Comparing peak FP16 performance is like comparing the performance of two PCs with different processor, memory, storage, and graphics options based solely on the frequency of the processor.”


“That said, we believe the real contest is not at the chip level. The challenge is scaling out compute accelerators to exascale proportions. Nvidia is taking its first steps with NVLink and pursuing greater accelerator independence from the processor. Nvidia is growing its software infrastructure and workload base up from single GPUs to clusters of GPUs.”


Google chose to scale out its original TPU as a coprocessor directly linked to a processor. The TPU2 can also scale out as a direct 2:1 accelerator for processors. However, the TPU2 hyper-mesh programming model doesn’t appear to have a workload that can scale well. Yet. Google is looking for third-party help to find workloads that scale with TPU2 architecture.”


对于Data center的training和inference系统来说,竞争已经不是在单一芯片的层面了,而是看能否扩展到exascale的问题(exaFLOPS,10的18次方)。而和TPU2的同时发布TensorFlow Research Cloud (TFRC),对于发展TPU2的应用和生态,才是更为关键的动作。大家可以顺便看看这次Google展示的板级和机架的照片。

AI芯片架构的争论真有意义吗?

对于一个AI芯片项目来说,考虑整个软硬件生态,要比底层硬件架构的设计重要的多。最终给用户提供一个好用的解决方案,才是王道。

而对于看热闹的我们,也许站的远一点,可以看到更多有价值的东西,争论也才更有意义。

高级产品经理眼 产品架构是怎样的? 2017-06-06 15:55:06

经历过需求的采集、分析和筛选,我们对产品的定位和用户的需求有了越来越深刻的认识,对整个产品方向的把控和版本迭代节奏也会更有感觉。这种感觉你也可以称之为“产品感”,虽然讲得有点悬乎,可又的确存在。以我个人的经验来看,不断地了解用户需求和场景,也是积累产品感的一种良好的方式。有了不错的产品感,我们要继续往前走,才能将产品推向一个更高的高度。


产品经理之前已经将产品第一个版本的功能需求都整理好了,也输出了一份详细的功能需求列表,这个时候要做的工作就是为产品搭建一个好的架构,也就是产品设计的第三个环节——搭框架了。任何一款互联网产品都应该有一个产品架构,有了这个强大而坚实的架构作为产品的基础,我们才能将产品需求给一个一个填充进去,让产品变的丰富立体,更有血有肉起来。


那究竟什么是产品架构,产品经理又该如何来搭建一套好的产品架构,我们来接着往下看。


什么是产品架构

任何一个产品都有自己的产品架构(也有很多人把它称为信息架构),就好比每一个人都有自己的骨骼系统一样,你的骨架大小决定了你大致的身材会是如何,每个人的身材都不一样,高、矮、胖、瘦各有不同。


有些产品的产品架构比较繁杂,例如大部分to b 的产品,如客户关系管理系统、ERP软件、电商网站的管理后台、物流管理后台、SaaS软件等;有些架构则比较轻便、简单,比如绝大多数的to c 的产品,像我最近在玩的图友、摩拜单车、直播APP映客、花椒等,当然还包括微信(虽说现在功能越来越多了,但大体架构依然是简单、清晰明了的)。


我们直接看几个例子:

深度|在高级产品经理眼里,产品架构是怎样的?

天猫商家工作后台

这是天猫商家的工作后台,看到左侧这一排满满的导航菜单了吗,是不是感觉超级复杂,光店铺管理就有超过10个二级菜单,要梳理好淘宝、天猫这种量级的电商平台产品架构可真不是一件简单的事。不过我也常常好奇一点,这么复杂的后台,卖家们都能清楚地知道每一个功能在哪里么。


复杂架构的产品,对产品经理的能力要求较高,需要产品经理能提供功能完备、结构严谨的架构系统,让用户能通过操作流程来使用各个功能。所以这样一个架构的特点是,它会带来一定的学习成本,有些甚至需要对产品的用户进行培训(像淘宝开设了淘宝大学以及淘宝社区)。这种架构产品的用户群体一般比较聚焦,只针对某一类人群,需要对海量功能进行合理整合、灵活布局来聚焦核心用户场景。



深度|在高级产品经理眼里,产品架构是怎样的?

脸萌官网

再来看一个例子,这是曾经爆红一时的脸萌app的产品官网,仔细分析一下这个官网的产品架构,是不是超级简单,简单到只剩下2个菜单——首页、关于我们。这里要注意一点,即使是简单的2个菜单(有些官网只有一个菜单),也依然构成了完整的用户体验,因为通过这个架构,网站的目标和用户的需求都已经得到了充分的满足。当然,如果你想要重新定义网站的目标,或是用户的需求发生了变化,那你就该去准备重新调整产品架构了。


轻架构的产品,它的目标就是提供给用户一个简单明了的信息架构,让用户使用方便、体验流畅。对于产品经理来说,设计轻架构的产品,难点在于体验和创新。我们可以通过给产品做减法来不断聚焦用户的核心使用场景,让用户简单易上手,等产品的用户体量上升到一个新的台阶的时候,再去拓展产品的使用场景,延展产品架构。


典型的几个产品架构模型

Jesse James Garrett在《用户体验要素》这本书中,为我们系统阐述了互联网产品的几个典型的产品信息架构模型。第一种信息架构模型比较符合我们产品经理对产品架构的理解和定位,后面三种信息架构模型,你可以当作是第一种模型的补充,或者你也可以把它当作页面级别的信息架构梳理。

第一种,层级结构(hierarchical structure

深度|在高级产品经理眼里,产品架构是怎样的?

层级结构模型

书中原文是这么来描述这种产品架构的——“在层级结构中,节点与其他相关节点之间存在父级/子级的关系。子节点代表着更狭义的概念,从属于代表着更广义类别的父节点。不是每个节点都有子节点,但是每个节点都有一个父节点,一直往上直到整个结构的父节点。层级关系的概念对于用户来说非常容易理解,同时软件也是倾向于层级的工作方式,因此这种类型的结构是最常见的。”


这种伞状式的产品架构,恐怕是互联网、移动互联网产品中使用最多的一种信息结构,比如我们使用频度最高的微信、手q,以及各类to c 的移动APP,甚至是复杂的to b 类产品,都是使用这种产品架构进行产品设计。这种架构的特点是符合人类的认知习惯,因为人类天生就有分类的习惯,比如书桌,我们会习惯把书籍放在一起,把录音卡带等放到一边;又比如我们的衣柜,我们一半会将不同季节的衣服放在不同的位置。在生活中,整理物品是为了更容易地找到自己需要的东西。


下图是蜻蜓fm早期版本的一个层级信息架构:

深度|在高级产品经理眼里,产品架构是怎样的?

蜻蜓fm的产品信息架构


在使用层级结构的时候,需要注意层级的深浅和宽窄这个问题。

大家都有过逛商场的经验,其实有时候做产品和逛商场很相似,有的商场设计的比较合理,很容易地能够让逛商场的用户找到想要的商品品类,有的商场设计却经常让你迷路,来来回回折腾好几次。在确定产品架构的时候,考虑产品架构的深度和广度成为了产品经理的一道必选题,就拿淘宝APP和唯品会APP来说,淘宝属于广而深的架构,唯品会则属于浅而窄的架构(相对)。在偏深度的架构中,用户操作起来效率不高,用户获取信息、完成目标任务的路径增多,但是相对而言,减少了用户选择的入口。在偏广度的架构中,用户面对的入口增多,在选择入口的时候比较费时,但是减少了用户的操作路径。

深度|在高级产品经理眼里,产品架构是怎样的?


广度和深度的架构模式

宽而浅的产品架构和窄而深的产品架构,各有优势和劣势,具体使用哪一种产品架构,关键是要结合自身产品的定位、业务特性、发展阶段和用户特征及使用场景来进行取舍和判断。


第二种,自然结构(organic structures

深度|在高级产品经理眼里,产品架构是怎样的?

自然结构模型

原文描述如下——“自然结构不会遵循任何一致的模式。节点是逐一被连接起来的,同时这种结构没有太强烈的分类概念。自然结构对于探索一系列关系不明确或一直在演变的主题是很合适的。但是自然结构没有给用户提供一个清晰的指示,从而让用户能感觉他们在结构中的哪个部分。如果你想要鼓励自由探险的感觉,比如某些娱乐或教育网站,那自然结构可能会是个好的选择;但是,如果你的用户下次还需要依靠同样的路径,去找到同样的内容,那么这种结构就可能会把用户的经历变成一次挑战。”


事实上,这种形态的产品架构一般在to c 的游戏、娱乐、资讯产品里面运用的比较广泛,例如优酷视频、好奇心日报等。当然,很多时候自然结构是应该结合层级结构来进行思考的,比如用户进入好奇心日报这个网站,可能的一种使用方式是,用户心里已经有一个明确的资讯目标,想看一下最近商业有发什么大故事,所以用户会点击上方的“全部分类”,选择电影,选择商业板块然后进行浏览。也有另一种使用方式,就是毫无目标,直接就是这么从上到下浏览下去,看到自己感兴趣的文章标题便点击进去。


深度|在高级产品经理眼里,产品架构是怎样的?

好奇心日报官网

自然结构很适合轻架构产品的浏览式形式,尤其比较适合to c 类的娱乐休闲类产品,因为这类产品的目标用户,绝大多数时候的使用场景都是无聊式地浏览,并没有明确的用户目标,也不需要解决什么特定的任务。


第三种,线性结构(sequential structures

依旧来看下原文描述——“线性结构来自于你最熟悉的线下媒体。连贯的语言流程是最基本的信息结构类型,而且处理它的装置早已被深深地植入我们的大脑中了。书、文章、音像和录像全部都被设计成一种线性的体验。在互联网中线性结构经常被用于小规模的结构,例如单篇的文章或单个专题;大规模的线性结构则被用于限制那些需要呈现的内容顺序对于符合用户需求非常关键的应用程序,比如教学资料。”


说的直白一点,所谓线性结构,就是你用一个讲述故事的方式去给用户介绍你的产品,多见于产品专题页、帮助文档的设计。其实这部分也没什么可讲的,关键是讲述故事或者问题的时候,你的思路是否清晰,很多时候这部分工作也会由运营的同事替我们代劳。

深度|在高级产品经理眼里,产品架构是怎样的?

金山快盘专题页

上图就是金山快盘做的一个活动专题页,通过线性结构讲故事的方式来将自己“100G空间永久免费”的活动宣传出去。


第四种,矩阵结构(matrix structure

深度|在高级产品经理眼里,产品架构是怎样的?

矩阵结构模型

书中是这么描述矩阵结构的:“矩阵结构允许用户在节点与节点之间沿着两个或更多的“维度”移动。由于每一个用户的需求都可以和矩阵中的一个“轴”联系在一起,因此矩阵结构通常能帮助那些“带着不同需求而来”的用户,使他们能在相同内容中寻找各自想要的东西。


举个例子来说,如果你的某些用户确实很想通过颜色来浏览产品,而其他人偏偏希望能通过产品的尺寸来浏览,那么矩阵结构就可以同时容纳这两种不同的用户。然而,如果你期望用户把这个当成主要的导航工具,那么超过三个维度的矩阵可能就会出现问题。在四个或更多维度的空间下,人脑基本上不可能很好地可视化这些移动。”


看了上面这段话,你的第一反应是不是想到了下面这个产品设计界面:

深度|在高级产品经理眼里,产品架构是怎样的?

淘宝的宝贝详情页

矩阵式的信息结构,需要将多种信息内容放置在一个页面里,所以它的重点和难点是在于如何做好信息分层,让信息更加有效率地传达给自己的目标用户,这个问题我们放在后面来讲。


总体来说,产品经理了解这几个典型的产品信息架构模型,对于后期自己设计产品架构的时候,会更加明确应该朝哪个方向进行努力。这就好比一个建筑师在设计房屋之前,都需要先有足够的建筑设计知识,其中搭建建筑物的框架便是其中少不了的重要一课。


在具体的工作场景中,大多数产品经理从事的工作基本会分为两个大类,一类是C端产品经理,负责和普通用户打交道,更考验对用户痛点和兴奋点的把握和拿捏;另一类则是B端产品经理,负责和企业用户打交道,更考验对业务本质和行业战略的思考。那么,具体这两种类型的产品该如何来搭建产品架构呢?


To C 类的产品如何搭建产品架构

先简单介绍下业务背景:

2014年开始变热的O2O行业,已经迅速从表层变革进入深水区,很多O2O相关商业模式被验证错误或者迅速发展壮大,这个过程无数创业公司创立和倒下。除了商场、吃喝玩乐商户、线下服务商户等成为O2O热点之外,到家模式也成为一个新热点,美甲的、按摩的、泡脚的手艺人很多都变成了流动作业(典型如河狸家),如果说吃喝玩乐等希望辐射的是商圈流量,那到家服务无非希望搞定社区这块“富矿”。

15年初,当时我所在的公司正好也看中社区O2O这个行业(当然是老板有相关资源,又觉得市场前景广阔),而做社区O2O,有个绕不开的门槛——物业,如果有谁愿意费力气去啃物业这块儿硬骨头,就能有机会赢得未来。

于是我们就组建了一个小团队,先去做了一番市场调研,看一下市面上的这些社区O2O产品都做了哪些连接社区居民的服务,得出了这么一份竞品分析报告:

深度|在高级产品经理眼里,产品架构是怎样的?

竞品分析报告

把玩了几十款APP后,我们发现只有少数几家公司的产品做了向业主提供在线支付物业费、停车费的服务,更别谈业主可以在线报修,呼叫安保等服务。


总的来说,当时的社区O2O还不算是一片红海,仍然有市场空间和机会进行切入。以产品的开发背景来说无非是两类APP,一类是“叮咚小区”“小区无忧”为代表的第三方创业公司,一类便是开发商自有的“住这儿”“彩之云”等移动端应用。


第一类像“叮咚小区”这种平台模式,没有用户基础,只靠烧投资人的钱来铺地面工作,当时来看是圈了不少小区,但是由于没有根基,用户随时会被抢走,想要做到成规模的应用不知道要烧多少年。目前传闻好像已经倒闭了,估计资本的钱也烧的差不多了吧。


第二类应用大都停留在试水阶段,扮演配合物业的角色,还没找到完整的盈利模式。“彩之云”可以算得上其中的优秀代表了,其垂直电商模式或许可以成为一个突破口,同阿里争夺“最后一公里”。

而当时的BAT等巨头还都持观望态度,没有太大动作,又或者是等待哪一家创业公司做起来之后再进行投资收购。很明显,大家都把这块难啃的骨头放在了一边。


由于当时公司在房地产物业这块有相关资源,所以,我们团队将产品的切入点定位在了物业公司,物业服务站和物业从业人员这里。而后,通过相关小区的试点,验证产品可行性后,再将产品的使用场景拓展到进行车位信息化管理、社区商户平台——商户通过物业平台入驻小区并投放广告、为成熟的业委会提供在线管理平台、社区教育等等。当时,产品的名字暂时就命名为“乐业安居”,正有让社区的老百姓拥有了我们的产品,就能安居乐业的意思。


经过一系列的产品设计准备工作,就要开始搭建APP的产品架构了。结合之前的市场调研及产品路径规划,以及团队对O2O的理解,梳理了一下我对社区O2O产品架构的规划思考,主要由4个tab组成:

  • 社区:负责连接人与人,这个部分可以满足邻里之间人与人的交流沟通,你既可以在这里发布相关信息寻求帮助或需求交换,也可以在这里找到志趣相投的邻居一起去做一件事情。包括后期的业委会、居委会等等,都可以在这里展示相关信息。
  • 物业:负责连接人与物业,这个部分就是通过移动互联网来改善业主和物业的连接效率,让物业的服务成本降低,效率提高,也提升业主的用户满意度。
  • 周边:负责连接人与O2O服务,这个部分就是第三方O2O(如家政服务、维修服务、养老服务、社区教育等)、电商团购的综合展示舞台,通过整合资源可实现有自己特色的O2O社区服务。
  • 我的:负责管理与”业主“有关的所有信息,如”我的报修“、”我的缴费“、若后面产品拓展做了社区教育,则还可能有”我的课程“等等。
深度|在高级产品经理眼里,产品架构是怎样的?

社区o2o的产品架构

当然,第一个产品版本的开发,打算就先做2个部分——”物业“和”我的“,既然是从物业作为切入点,就先把这个点做好,后期在相关小区试点可行后,立即迭代产品,再引入其他功能让产品的使用场景变得更加丰富起来。


如果你仔细分析,应该可以看出这里面的框架逻辑——连接。

这里就涉及到对O2O最本质的理解,它的本质是什么?O2O本质其实就是用互联网去改善消费者和服务提供者的连接,让他们之间的连接变得效率更高、成本更低。所以整个产品架构都是围绕着连接去做的功课,连接人与人,人与物业服务、人与其他服务,这样对于用户来说,他们对你产品的认知逻辑就会非常清晰,每一次打开产品的时候,都能够轻松地找到自己想要的东西。


就这个案例,我们尝试着来做一点总结:

1. 做好分类

前面我们就已经说过一点,人类天生就有分类整理的习惯,有这个习惯也是为了更方便地找到自己所需要的东西。超市里的商品摆放也是如此,所有的商品需要按照不同的分类,摆放在不同的货架上,并且上面还要贴上相应的指示牌,告诉用户这是什么商品区域。

我们常用的Windows 资源管理器也是一个极佳的例子,试想一下:如果我们将自己电脑上的所有文档都归存在一个盘里,而且这个盘并没有文件夹的形式让你分类管理你的文件,word文档、excle文档、ppt文档、pdf文档、视频文件、图片格式文件等都混杂在一起,那你想要找到自己需要的文档也则太难了。幸好在Windows 资源管理器模式下,我们可以创建文件夹,并且可以按照文件的名称、修改日期、类型、大小等进行排序和分组,这样才方便了我们更加快捷地找到自己所需的信息和文档。

同理,网站或者移动APP应用也是如此,信息越多,就越需要组织和整理。我们可以根据逻辑习惯来对信息进行分类整理,如上面所举的例子,就是根据社区O2O“连接”的逻辑进行分类的;当然,也可以直接去探究用户的想法,了解用户的使用习惯。一个好的产品经理,往往也是这个行业的资深人士,或者称为行业专家。因为只有产品经理自己本身对所处行业有极深的理解,他才能更准确地命中产品架构的脉门,有时候甚至是一击而中。

2. 平衡用户与商业

对产品架构的设计,一方面是要了解用户的信息需求,另一方面也要了解整个产品的商业目的和诉求。一般情况下,用户目标和商业目标之间肯定存在着矛盾,比如用户都不想看广告,但企业又希望能够把自己的业务和广告推荐给用户(典型如微信的朋友圈广告)。如果一个产品只满足用户的目标,产品体验当然会不错,但这个产品也很难走的长远,毕竟企业的终极目标是要盈利的。

这个时候,如何平衡用户与商业,就成为考量产品经理的功底的重要一环了。在这方面,我们向微信团队进行学习,微信在平衡用户体验和商业目标这一块做的非常好。还记得2015年1月份的朋友圈广告么,当时一经推出,便立刻成为了朋友圈的热门话题,大家都争相在广告底部进行点赞和评论,仿佛品牌一下子就成为了我们身边的朋友一样,在朋友圈直接与我们分享故事和内容。而在社区O2O这个案例中,我们也将周边这种带有业务、广告性质的功能,放在了后面的版本进行迭代开发,并没有立即尝试进行产品的商业化,这也是一种平衡的体现。

深度|在高级产品经理眼里,产品架构是怎样的?

微信广告

3. 重要的功能设置快捷入口

产品架构应该是结构清晰、合乎逻辑的,让有明确目标的用户能够快速找到所需信息;有不确定目标的用户,通过浏览和寻找,一点点地明确自己需要的信息;没有目标的用户,则可以在探索中激发需求。所以,对于后两者用户来说,如果重要功能和常用功能隐藏地太深,则很有可能会让他们对产品丧失兴趣。

为重要功能和常用功能设置快捷入口,就好比在原有的产品架构上搭了一个“快捷通道”,典型如微信将“购物”放在了“发现”这个菜单里,手Q的“购物”入口改成了“京东购物”,京东和腾讯的“联姻”,由微信和手机QQ社交应用入口、朋友圈、朋友群、公众号、广点通,以及线下推广共同组成了多场景的京东社交购物生态,汇聚了庞大的社群流量,为京东带来了不少的新用户和成交增长。


当然,快捷入口的设置也是一个需要权衡的过程。必要的快捷入口可以提高用户的使用效率,也能满足产品一定的商业目标,但是如果快捷入口过多(尤其是参杂太多商业目标的快捷入口),产品也会变得混乱和复杂,这个时候就会让用户的使用效率下降,有点得不偿失了。所以你会看到,微信这款产品,并没有把所有的业务都通过快捷入口的方式展现出来,而是通过在“我--钱包”里面,展示其他的第三方服务。这么一来,这些功能隐藏地如此之深,产品的用户就不会觉得微信是一款复杂而混乱的产品了。


深度|在高级产品经理眼里,产品架构是怎样的?

京东微信手机QQ购物两周年庆典


当然,在业余时间我们自己把玩产品的时候,也可以试着去解构一下其他公司的APP产品,看下他们的产品架构是如何搭建的,又有什么地方是值得学习和借鉴的,这也是一个非常重要的学习手段。

说一下我常用的方法,分三步来走:

  1. 拆解产品骨架,将所有模块和功能点画成思维导图
  2. 分析重点功能的使用场景与流程
  3. 分析次要功能的使用场景与流程

当然,分析产品的时候需要考虑很多因素,不仅是从产品设计出发,还要从行业背景、公司战略、运营、实际资源等情况出发,才能得出更接近真相的答案。


To B 类产品如何搭建产品架构

To B类产品(通常都是后台产品)的设计非常具有挑战性,因为To C类的前台产品,大家都已经培养起了使用习惯,对功能有一定程度的理解,见过的模式足够多,能够建立起一定的产品模型,也容易找到参照物去模仿。但是To B类的后台产品,你几乎没有什么竞品可以参照和模仿,所以在搭建产品架构的时候则要求产品经理非常懂业务,非常考验PM的核心竞争力——业务知识储备、结构化思维和系统性抽象能力。不同行业的产品可能做整体架构的思路也不一样。


稍微简单类比一下,产品架构复杂程度的感觉由弱到强是这样的——

设计或者操控以下交通工具:

  • 自行车
  • 汽车
  • 飞机
  • 火箭
  • 宇宙飞船

……


是不是感觉到难度越来越大了,不过我们也算是了解了复杂产品的架构是怎么样的了,其实依然还是有对应的方法去进行设计的。在对后台产品搭建产品架构的时候,往往有两种思路可供参考:

1.按功能模块来进行划分

什么叫按功能模块来进行划分?如下图:

深度|在高级产品经理眼里,产品架构是怎样的?

按功能模块来划分

如果一个后台产品的目标用户比较单一,且用户需求也比较统一,并没有出现说某个用户只需要使用其中某一个功能模块的时候,且功能和功能之间并没有太多的逻辑关系,往往可以尝试使用按功能模块来进行划分的方式。比如百度移动统计,它的目标用户就是互联网公司内部的运营人员、产品人员,且运营和产品关注的数据绝大部分是可以通用的,也就是说用户需求还是比较统一的。


2.按业务逻辑来进行划分

另一个划分逻辑,是按业务逻辑来进行划分。很多公司内部的信息管理系统,都是采用这种产品架构来进行设计的,因为这个产品的目标用户往往涉及到多方角色,既有公司的业务人员,如市场、销售、客服、前台等,又有公司的职能部门人员,如人事、财务、行政等。这个时候再采用功能模块来进行后台的产品架构梳理,则显得不是那么适用了。


按业务逻辑来进行划分,则要求产品经理在规划系统时要思考这个系统的作用到底是解决了什么问题,再具体一点就是——解决了哪些用户的哪些问题。在这个大的环境下确定了之后,在需求的收集和分析的阶段,就应该按照业务角色来进行相关的工作,而后到了梳理产品架构这一步才能更得心应手一些。如下图所示,一个研发管理的子系统,就对应了这么多不同角色人员的不同需求。

深度|在高级产品经理眼里,产品架构是怎样的?

按业务逻辑来划分


那么,产品经理在做to b产品的时候,进行业务规划和产品架构之前需要储备哪些方面的能力呢?

  • 需要有一定的技术理解能力,帮助自己理解清楚信息在不同的系统之间是怎样交换、存储、耦合和解耦的。
  • 要有基本的商业逻辑思维,比如节省成本、提高营收、提升效率等。
  • 业务的整合需要对所在行业及业务本身有深刻的理解,同时对公司整体的运行逻辑也要有一定的认识,如销售、市场、财务、运营、产品、技术等。
  • 需要有更强的抽象能力。不仅是把一个工作流程抽象成一个功能,而是要把一个业务抽象成一个系统,并且知道这个系统在产品中所处的位置;不是理清任务与任务之间的关系,而是要清楚业务与业务之间的关系,这样的关系最后是如何交织和演化在一起,共同促进产品繁荣的。


最后,这里提供几个优秀的后台产品供大家参考和研习:

  • 淘宝的商家后台
  • 有赞微商城的后台
  • 微信公众平台后台

总结来说,产品架构这件事情涉及的面非常广,上至产品的宏观计划,下至产品的功能模块,囊括产品的目标及愿景、用户需求、商业需求、数据业务流程和设计框架,还涉及到产品的生态结构,所以要搭建好一套产品框架并不是件易事。产品经理在这条道路的学习上,也要做好一个漫长的认知迭代准备。


好的产品架构具有怎样的特性

好的产品架构对于一个产品来说是非常重要的一件事情,就如同人的骨架之于人,房屋的框架之于房屋,是起到支撑、引导、承重的作用。说回到互联网产品,好的产品架构要具备的几个特征,总结起来大致是这么几个点:易用性、稳定性、可扩展性。


什么是易用性呢?人的天性是懒惰的,试想如果用户在一次简单的使用产品后能记住每一个操作,而且能重复使用,不用刻意学习具体的操作,使用起来一定是很“爽”的。对于产品经理来说,我们必须竭力让用户能够方便地使用产品,这就需要产品架构上能够提供一个清晰的路径导航,让用户不会产生迷路等不爽的用户行为了。


什么是稳定性呢?这部分又通常和后台的技术架构有所关联,当产品不断演进和迭代的时候,系统的架构是否能够承受那么多用户的同时访问,在性能和响应速度方面有没有什么影响。所谓的稳定性原则,就是说你提供的服务一定是稳定可靠的,是能及时响应需求的,尽量避免类似APP上突然有提示失败、服务器异常、空等情况。


易用性和稳定性,就不再多用文字解释了,我们来看看产品架构的可扩展性。

可扩展性其实是在传达一个信息,就是要求产品经理在设计产品架构的时候,就要去多思考未来这个产品是否会新增加功能或者内容,也就要求产品经理要有产品规划的意识。如果一个新做的产品刚上线没多久,因为要新增功能,导致页面的信息架构重新调整,相关人员怨声载道,产品的使用用户也会增加对产品的认知成本。可见,产品架构的可扩展性是有多重要,产品经理需要根据实际情况及未来可预见的规划进行构思,争取将产品的维护成本降到最低。

金准数据中国消费金融洞察报告 2017-06-06 14:17:23

一、互联网消费金融行业概述





互联网消费金融发展动力

年轻群体可支配收入少、超前消费意愿强烈


2016年,按照中国人均可支配收入能力划分,30岁以下的群体中75.3%的人每月可支配收入低于6000元。在40岁以下人群中,近4.5成人群曾使用过分期消费功能,超3成人群没有使用过分期消费,但对此很感兴趣。


以90后为代表的年轻群体,成长于互联网与移动互联网时代,便捷化、即时享乐是他们价值观的组成部分,加之支付便捷化使得他们的货币观念减弱,在消费受收入水平制约的背景下,超前消费意愿强烈。



互联网消费金融发展动力
信贷人口渗透率不足三成,传统金融机构服务能力有限

2015年,我国信贷人口渗透率仅为27.6%,而同时期美国信贷人口渗透率为82.0%。美国消费金融产业在历经了70余年的发展后,信贷人口渗透率高,这得益于消费观念的转变、法律监管和配套措施的成熟、科技进步等原因。相较于美国的渗透率水平,我国信贷人口渗透率明显不足,除了社会观念和顶层设计外,过去传统金融机构的服务能力有限也是造成这一现状的重要原因。

长期以来,我国传统金融受到政府过度保护,存在业务模式僵化、业务覆盖面有限、扩大业务动力不足、风险定价能力单一等问题。 






分析:看好互联网消费金融的未来

从大环境来看,我国经济在历经高速发展后,依靠投资驱动来拉动经济增长的模式进入了瓶颈,在大力引导依靠消费驱动来拉动经济增长的当下,政策向消费金融倾斜。与此同时,我国的信贷人口覆盖率相对于发达国家还有很大的上升空间,传统金融机构的缺位为互联网金融机构带来发展的契机。借助移动互联网和新兴科技,未来互联网消费金融机构还将有长足发展。



二、互联网消费金融行业发展现状



互联网消费金融市场规模

千亿级互联网消费金融市场


互联网消费金融从2013年开始到2016年,其交易规模从60亿增长到了4367.1亿,年均复合增长率达到了317.5%。艾瑞咨询认为,整体市场高速增长的原因主要包含以下几方面:首先,参与主体逐步丰富,从之前P2P为主导拓展到目前以电商生态和网络分期平台为基础,参与其中的企业数量和类型较2013年有明显突破;其次,新兴市场不断被开拓,大学生、蓝领等新兴消费金融市场被企业深耕,长期被压抑的消费金融需求爆发式释放;最后,我国政府对互联网消费金融的发展持鼓励扶持态度,这也是互联网消费金融市场得到高速发展的重要因素。







消费金融的场景化趋势

场景化一定程度上满足消费金融关键要素

 

场景化通过对消费中进行金融服务的嵌入,来刺激或促使消费者通过信贷的方式完成消费交易。促进作用体现在精准捕捉潜在信贷客户,以及对客户的需求启发两个方面,除此之外,场景化必然要求消费金融机构对消费产品、客户进行深入研究与刻画,基于这种刻画,消费金融机构得以根据产品特性提供针对性金融服务,风控得以更准确地定位风险点,使得风险定价更为准确。



三、秦苍科技案例分析


秦苍科技企业基本情况介绍

你的梦想,我来买单——中国年轻群体的“移动信用卡”

 

上海秦苍信息科技有限公司成立于2014年3月,以“你的梦想,我来买单”为宗旨,专注于为中国年轻群体提供小额消费分期付款和消费金融服务,是国内较为领先的金融科技公司。旗下App“买单侠”、“星计划”是消费分期技术产品,通过大数据算法模型和人工智能给年轻群体提供快速消费分期服务。


买单侠创始团队成员拥有高等学历,分别毕业于斯坦福、清华、南京大学、复旦、交大等知名学府,并曾经就职于红杉资本、微软、谷歌、Autodesk、硅谷顶级投资机构以及国内顶尖银行,在技术、风控、销售、财务等方面均积累了丰富的经验,为进入新领域奠定基础。截至目前,公司员工人数约1000人,其中技术研发和风控管理人员人数超过400人。




秦苍科技业务流程

坚持线下场景获客,注重精细化运营


客户在消费过程中通过扫描店员(面诊师)手机上的二维码进行分期操作,由于二维码具有唯一性、并有严格的申请时间限制,秦苍科技实现将获客途径限制在线下场景。

 

在业务流程中,秦苍科技注重精细化运营。在店员体验上,秦苍科技通过随机红包的方式,利用游戏心理增加店员对秦苍科技平台的使用。对于用户而言,通过快速放款、保障信息安全、合理的催促还款安排等方式,打造良好的用户体验。



秦苍科技客户群体

场景+主动营销=新优质人群

 

秦苍科技线下场景获客与主动营销的结合,使得其客户群体为新优质人群。新优质人群,指的是2.5亿年轻蓝领和初级白领中信用良好的人群,他们中有中国人民银行信用报告的不到20%。他们难以通过传统金融机构获得资信的原因并非因为不够守信,而是传统方式难以对他们进行风险定价。新优质人群具有共债低、杠杆较低、用户粘性高的特点。






秦苍科技风控体系

贷中风控:机器学习定义风控的未来

 

秦苍科技利用机器学习完成部分风控任务,机器学习在风控方面可以极大地释放人工,同时在理论上可以实现比人工识别更好的效果。具体应用过程中,秦苍科技利用冠军挑战者的方式不断优化模型,内置多个算法,且在业务的扩大过程中稳步渗入新的机器学习算法,在保证安全性的基础上推进风控的革新。



四、秦苍科技案例启示






中国农业地图 2017-06-06 13:08:17

维生素不但无益,反而可能致癌 2017-06-06 12:39:41

最近几年,将维生素补充剂当作保健品,成了国人追逐健康的重要手段。但在地球另一端,欧美学界、媒体最近正掀起一股“讨伐”维生素保健品的热潮:从英国BBC、卫报,到美国纽约时报、华尔街日报、大西洋月刊;从诺奖得主,到医界翘楚······

01、纽约时报:卖给傻子的“大补丸”,别在维生素和矿物质上花冤枉钱

2015年2月,

纽约时报撰文指出,

维生素是卖给傻子的“大补丸”。

服用一种药丸,

你会变得更聪明。

服用另一种,

你会瘦下来。

再一种,能让你变得快乐。

还有一种,会令你充满活力。

如果纽约和加拿大的科学家测试发现,

这些神奇大补丸里面,

可能只有磨成粉的稻米或家养植物,

那又如何呢?

只要有足够多的人相信自己会变得更健康,

这就是一个不错的诈骗业务。

在很多情况下,

这些东西甚至连食品都算不上。

药物必须经过联邦政府的严格测试和审核,

膳食补充剂则不用。

药物必须被证明是有效的,

膳食补充剂则不必。

这些是带有奇幻属性的玩意——

植物、草药、矿物质、酶、氨基酸、干货等等。

它们是“纯天然的”,而且不便宜。

美国人像吃彩虹糖一样把它们往嘴里塞,

尽管最近的多项研究显示,

市场上的所有草药补充剂中,

将近三分之一可能是彻头彻尾的假货。

美国癌症学会警告:

“市面上流传着很多错误信息。

对于膳食补充剂的安全使用方法和潜在风险,

就连一些见多识广的人,

恐怕都难以找到可靠的信息。”


02、BBC:破灭的维生素神话,基本没用,甚至会更早地将你送进坟墓

2014年12月,

BBC在一部纪录片中指出,

当我们不停服下各种抗氧化剂,

并将其视为灵丹妙药时,

好的情况是,它们没有什么卵用;

坏的情况是,它们会更早地将你送进坟墓。

在1994年,一项从50年代开始,

受试者共计29133人的试验完成了。

所有受试者都是烟民,

但只有其中的一些被给予了β-胡萝卜素补充剂。

然而在该组中,

肺癌的发病率增加了16%。

在美国的绝经妇女中,

也得到了类似的结果。

她们每天服用叶酸(多种维生素B族)并持续了10年后,

与没有服用补充剂的妇女相比,

患上乳腺癌的风险增加了20%。

事情还在变得更加糟糕。

在1996年一项关于1000多名重度吸烟者的研究,

不得不在两年前提前终止。

因为在仅仅为时四年的β-胡萝卜素和维生素A补充获取之后,

受试者的肺癌发病率增加了28%,

而死亡率增加了17%。


03、大西洋月刊:维他命神话,为什么我们需要膳食补充剂?

2013年7月,

拥有150多年历史、

美国最受尊敬的杂志之一的《大西洋月刊》撰文指出,

维生素可以预防疾病没有科学依据;

大量长期摄入维生素,

会致病甚至致命。

来自明尼苏达大学的研究人员发现,

那些长期服用多种维生素的女性,

死亡率要比那些不吃的高。

两天后,

克利夫兰医学中心的研究人员发现,

那些长期服用维生素E的男性,

前列腺癌发生率有增高趋势。

之前有7项研究已经显示,

维生素会增加罹患癌症、心脏病,

以及减少寿命的风险。


04、华尔街日报:这是维生素热的终结吗

2013年12月,《华尔街日报》发表了

《这是维生素热的终结吗》一文,

指出了维生素的危害。

文章说,

一些抗氧化剂,

被吹捧为有癌症预防能力,

并能保护大脑,预防老年痴呆症。

但在一项研究中,

有7500名男性被分成了4组,

分别给予维生素E、硒,或安慰剂,

试验共5年。

结果表明,

老年痴呆症的患病率没有显着差异。

四位医师和公共健康专家,

在伴随研究发布的评论中写道:

传递出的信息很简单,

那就是大多数食物补充剂,

无法预防慢性疾病或死亡,

并没有服用它们的正当理由,

应当避免服用。

在其他一些试验中,

β胡萝卜素、维生素E,

以及还可能包括高剂量的维生素A,

会增加死亡的风险。


05、卫报:别再相信抗氧化膳食补充剂的广告了,每日服用维生素片剂可提高疾病风险

2012年5月,

英国《卫报》刊登文章说,

膳食补充剂有益健康的主要元素是它的抗氧化剂,

但美国科学家最新研究发现,

服用这些抗氧化的膳食补充剂,

其健康功效基本上只是一个“神话”。

两位拥有营养医学硕士学位的药剂师Aidan Goggins和Glen Matten,

曾写过一本名为《健康幻觉》的书中,

讨论抗氧化剂的风险。

两位专家指出,

过去研究中所推崇的抗氧化剂,

都是从天然食物如蔬菜、水果中直接提炼的抗氧化剂,

并不是现在我们吃的这些合成片剂。

这些都不是最糟糕的,

更让人意外的研究结论是,

科学家们逐渐发现,

自由基其实对人体健康也是必需的,

可以帮助免疫系统抵抗外部感染,

甚至能预防癌症和降低癌症死亡风险!

通过正常的膳食,

我们体内原本是一个均衡的状态,

抗氧化剂与自由基势均力敌,

顺利运作,

随意补充抗氧化剂无疑会打破这一平衡。

一顿营养丰富的果蔬餐,

一般只含有200毫克的维生素C,

而小小一片维生素片,

就有1000毫克的维生素C。

总之,无论是维生素还是矿物质还是其他营养素,

最安全的方法就是从天然食物中摄取。


06、Business Insider:大多数膳食补充剂是无效的,但这里有适合你的一种

美国的知名科技媒体Business Insider ,

在《大多数膳食补充剂是无效的,但这里有适合你的一种》一文中,

谈到了几类膳食补充剂,

逐个分析你是否需要它:

蛋白粉,

可以使用坚果、豆腐、鱼和肉类取代它;

锌,

服用它,可以让感冒提前痊愈;

氨基酸,

可以吃肉代替;

抗氧化剂,

会增加某类癌症的风险,可以食用浆果代替;

叶酸,

当怀孕时可以遵医嘱服用;

绿茶提取物,可以一试,

它可能会有益于你的健康,并证明是安全的;

鱼油,

可以食用三文鱼取代;

人参提取物,

科学家认为需要更多试验证实它的安全性;

银杏提取物,

研究证实它无效,请忽略……


07、诺奖得主、医界翘楚:维生素片不仅无益,反而致癌,是个残酷骗局

▲诺奖得主“DNA之父”詹姆斯•沃森

2013年,85岁的诺奖得主、“DNA之父”詹姆斯•沃森,

曾在《新科学家》上撰文称,

很多研究显示,

服用大剂量的维生素会升高癌症和糖尿病风险。

维生素片不仅无益,反而致癌,

是个残酷骗局。

2013年12月17日,

美国《内科医学年鉴》又发表了一篇文章,

题目就叫做:

《够了!别在维生素和矿物质补充剂上浪费钱了》。

这篇文章的结论是:

普通(有正常饮食能力)的人群,

服用维生素补充剂或者矿物质补充剂没有益处,

相反倒可能有害。

不要指望着服用维生素能预防慢性疾病。

而这篇文章的作者,

均为医学界翘楚。

约翰霍普金斯医学院Welch疾病预防中心的

医学和药学博士Eliseo Guallar、

医学博士Lawrence J. Appel、

医学博士Edgar R. Miller

英国Warwick大学医学院医学博士Saverio Stranges

该杂志的高级副主编、医学博士Cynthia Mulrow


08、中国学者、医生

▲ 云无心 食品工程博士、美国食品技术协会高级会员

云无心说,平心静气地说:

如果因为身体状况或者生活方式特殊,

而无法从食物中获得某些种类的维生素或者矿物质,

那么服用补充剂是有益而且必要的;

但对于能够正常饮食的人们,

服用补充剂不会带来健康上的好处,

甚至可能增加某些慢性疾病的风险。

广东省中医院中医经典科主任颜芳说,

当又一位病人在我门诊时,

从包里掏出3、4个花花绿绿的瓶子问我,

“主任,这些维生素能吃吗?应该吃吗?”

我还是有些被惊呆了!

也意识到应该重视这个问题了,

很有必要把这个很多人共性的疑问解释清楚。

因为我知道,

任由错误的养生方式大行其道,

其实也是在谋害民众的健康!■



AI 入侵翻译,神经机器翻译进化让巴别塔7年内成真 2017-06-06 10:50:46

“从事翻译的人很可能会看到一些工作机会在不断消失,他们必须要习惯一种‘创业思维’。”

5月27日,中国围棋大师柯洁在与AlphaGo的围棋对决中输掉最后一盘,0:3输掉全部比赛。当下,AI 所激起的惊慌不仅在围棋界蔓延,而且扩展到了几乎每一个领域,翻译受到的冲击尤为严重。现在,谷歌等公司向全世界提供免费的翻译服务,并且,已经可以提供“可理解”的翻译结果。


牛津大学最近完成了一项对机器学习研究人员的大型调查,调查内容是他们对 AI 进展的看法。综合这些研究人员的预测,未来10年,AI 将在许多活动中表现超过人类,例如翻译语言(到2024年),具体预测见下表:

「深度」AI 入侵翻译,神经机器翻译进化让巴别塔7年内成真


近年来,深度学习对翻译的最大影响,来自基于神经系统的机器翻译(NMT),这一技术将机器翻译的准确率大大提升。


谷歌2016年推出可商业部署的神经系统机器翻译,准确率达86%

在十年前推出时,谷歌翻译采用的是基于词组的机器翻译(PBMT),几年前,谷歌大脑团队开始使用循环神经网络(RNN),直接学习输入序列到输出序列之间的映射。基于词组的机器翻译(PBMT)是将句子拆分成字词后单独翻译,而神经网络机器翻译(NMT)则将输入视为一个整体进行翻译。这样做的好处是翻译时需要进行的调整少了很多。


当神经网络机器翻译技术刚刚出现时,就在中等规模的公共数据集上取得了与 PBMT 不相上下的成绩。自那时起,从事机器翻译研究的人提出了很多种方法改善 NMT,包括使用注意力将输入和输出对齐,将单词拆分成更小的单元或模仿外部对齐模型应对生僻字词。尽管如此,NMT 的表现仍是不足以成为产品被大规模部署。


首先,网络将汉字(输入)编码成一串向量,每个向量代表了当前读到它那里的意思(即 e3 代表“知识就是”,e5 代表“知识就是力量”)。整句话读完之后开始解码,每次生成一个作为输出的英语单词(解码器)。


要每一步生成一个翻译好的英语单词,解码器需要注意被编码中文向量的加权分布中,与生成英语单词关系最为密切的那个(上图中解码器 d 上面多条透明蓝线中颜色最深的那条),解码器关注越多,蓝色越深。


使用人类对比评分指标,GNMT 系统生成的翻译相比此前有了大幅提高。在几种重要语言中,GNMT 将翻译错误降低了 55%-58%。

「深度」AI 入侵翻译,神经机器翻译进化让巴别塔7年内成真

此外,谷歌大脑团队还宣布 GNMT 汉英英汉试用版上线。现在,谷歌翻译汉英语言的移动版和网页版都率先使用 GNMT,每天负责 1800万次翻译任务。


谷歌大脑团队表示,GNMT 的上线得益于 TensorFlow和深度学习专用加速器张量处理单元(TPU),尤其是后者,提供了足够的计算能力来部署这些功能强大的 GNMT 系统,同时满足谷歌产品严格的延迟要求。谷歌大脑团队表示,今后的几个月里将持续推出更多的语种服务用户。


机器翻译的挑战仍然存在。GNMT 还是可能会犯一些人类绝对不会犯的错,比如漏译、误译专有名词或罕见词,翻译时没有考虑到整段话乃至全文的意思。总之,GNMT 有待改善的地方还有很多,但无论如何,GNMT 都代表了一座重大的里程碑。他们感谢过去几年中谷歌内外以各种形式参与这项工作的研究人员和工程师。


「深度」AI 入侵翻译,神经机器翻译进化让巴别塔7年内成真

谷歌最新技术在将英语翻译为西班牙语时,最高将准确率提高到 87%

现在谷歌翻译在中国已经可以使用,这被认为是谷歌计划回归中国的前哨。

谷歌成为“被超越者”,巨头纷争促进商业化


看到机器翻译巨大价值的绝非只有谷歌,中国的百度、华为、阿里和腾讯都有研究,Facebook 和微软等巨头也没有落后。这一种竞争态势,将会最大程度地推进机器翻译的商业化部署,进而变得对更多的人“可用”。


1. 百度:比谷歌早一年,口译领先

12月21日,百度举行机器翻译技术开放日。负责人吴华博士说,谷歌翻译在基于统计的机器翻译上做得很好,处于领先地位,但是在基于神经网络的机器翻译上,百度走在了前面。并且,谷歌翻译是以英语为中心的,百度翻译的中心是中文。另外,在语音的翻译上,百度要领先一些。

在接受新智元的专访时,她说:“谷歌翻译是处在一个领先地位的,但我们的优势在于,在基于神经网络的技术上,我们是有点领先的。谷歌翻译发新闻通稿,里面也引用了我们很多之前发表的一些文章,这个大家如果关注的话可以查到。在神经网络这条线上我们是走在前面的,虽然他们在统计翻译里还是走在前面的。”

她还补充道:“在线上的翻译系统里,我们在口语翻译上实际上是明显超越谷歌的,这一点大家可以随便去试试看看。”


2. 华为:与谷歌翻译持平,提高译文重视度

华为诺亚方舟实验室在他们一篇被 AAAI 2017 录用的论文里提出了一个新的神经机器翻译(NMT)模型,引入基于重构的忠实度指标,结果显示该模型确实有效提高了机器翻译的表现。华为诺亚方舟实验室的研究人员表示,他们的 NMT 技术与谷歌持平。

「深度」AI 入侵翻译,神经机器翻译进化让巴别塔7年内成真


3. Facebook 使用CNN技术而非传统的RNN,翻译速度比谷歌快9倍

Facebook今天发布了一项新的机器翻译技术,使用CNN技术而非传统的RNN,在翻译准确度超越了此前被认为是2016年10大AI突破技术的谷歌机器翻译,并且翻译速度上快了9倍。Facebook称,创下新的世界纪录。目前,这一技术已经开源。

Facebook 在官方博客中称,他们的技术在机器翻译峰会(WMT)所提供的公共基准数据集上,相比RNNs2,取得了新的最高水准。特别是,基于CNN 的模型准确度也超越了被用于评判机器翻译准确度的业界广泛认可的数据集WMT2014 英语-法语翻译任务中的历史记录 1.5 BLEU。在WMT 2014 英语-德语的翻译中,提升是0.4 BLEU,WMT 2016英语-罗马尼亚语,提升到1.8BLEU。

基于神经网络的机器翻译技术要用于实践,其中的一个考虑的要素是,在我们把一句话输入系统以后,需要花多长时间,才能获得相应的翻译。 FAIR 的 CNN 模型在计算上是非常高效的,比企鹅比最强的RNN系统要快9倍。有很多的研究一直的着眼于如何通过量化权重或者精馏(distillation)的来提升速度,这些方法同样也能被用到CNN的模型中,来提升速度,甚至还能提升更多。这意味着,CNN 有着巨大的潜力。


4. 阿里巴巴:一年2500亿次调用,节省25亿美元

阿里翻译团队自2016年10月起正式开始自主研发NMT模型,2016年11月首次将NMT系统的输出结果应用在中英消息通讯场景下的外部评测中并取得了不错的成绩,翻译质量有了大幅度提升。

「深度」AI 入侵翻译,神经机器翻译进化让巴别塔7年内成真

在2017年4月份的英俄电商翻译质量优化项目中,分布式NMT系统大大提高了训练速度,使模型训练时间从20天缩短到了4天,为项目整体迭代和推进节省了很多时间成本。

学术界的百花齐放:争鸣的研究为翻译应用提供坚实的技术支撑

学术界对神经机器翻译(NMT)的研究兴趣不减。今年到5月份为止,在开放存取论文网站 arXiv.org 上发表的有关 NMT 的研究论文数量几乎相当于2016年全年的该主题论文数量。研究领域的火热,对于提供商业可用的翻译技术提供了最强大的技术支撑。

「深度」AI 入侵翻译,神经机器翻译进化让巴别塔7年内成真

截至5月7日,arXiv.org 存储库中在标题或摘要中包含 NMT 的论文共有137篇,其中2014年发表的只有7篇,2015年增加到11篇。发生突破的是2016年,发表的论文达到67篇。

腾讯今年有两篇论文贡献出来。 一篇来自其深圳的 AI Lab(《神经机器翻译源句法建模》(Modeling Source Syntax for Neural Machine Translation)); 另一篇,来自腾讯移动互联网部门(《使用线性关联单位的深度神经机器翻译》(Deep Neural Machine Translation with Linear Associative Unit)),这是和苏州大学、中国科学院及都柏林大学的联合研究。

北京的微软亚洲研究院今年也开始进行 NMT 方面的研究。本月刚上传了两篇论文(《对抗神经机器翻译》(Adversarial Neural Machine Translation)和《MAT:图像字幕多模态转换器》(MAT: A Multimodal Attentive Translator for Image Captioning))。

  • 谷歌论文:https://arxiv.org/abs/1703.03906

  • 哈佛大学论文:https://arxiv.org/abs/1701.02810

  • Facebook 论文:https://s3.amazonaws.com/fairseq/papers/convolutional-sequence-to-sequence-learning.pdf

  • 腾讯论文:https://arxiv.org/abs/1705.01020

  • 中国移动论文:https://arxiv.org/abs/1705.00861

  • 微软论文:https://arxiv.org/abs/1704.06933

应用层面的机器翻译:目前胜在免费和速度

就在柯洁与AlphaGo进行第三场比赛的那一天。韩国科学技术院的生物与大脑工程教授 Jung Jae-seung 在一场名为“人工智能与翻译的未来”的论坛上说,AI 驱动的翻译将会承担大量现有人类翻译所做的工作。


“如果能理解不同语言之间的文化,并为之产生最好的相应文本,就可以定义为好的翻译的话,基于人工智能的翻译因为能够从不同的文化中搜集大量的数据,所以肯定在最后会超越人类”,他说。

他还提到了今年2月,国际翻译协会(International Interpretation and Translation Association)组织的一场人机翻译竞赛。那场比赛得出的结果是,如果忽视速度和成本,人目前在翻译的准确度上确实比机器更高一筹。


“我们不应该认为这一差距在未来还会持续”,Jung 说,“虽然很难接受,但是考虑到有充足的数据,谷歌等科技公司会有巨大的优势。正如AlphaGo 击败了李世石一样,我们都不知道它到底有没有理解游戏规则。AI 驱动的翻译可能也会直接跳跃过理解句子的阶段,在翻译上超越人类”。


AI 驱动的翻译目前最大的好处在于免费和速度快。“如果AI 驱动的翻译准确率能达到93%,而几乎不需要付出什么成本,并且速度极快。那么,人们会在大多数的翻译场景下使用它”,Jung说。

在口译领域,同样的颠覆性变革也正在发生,在这一行业中,速度的重要性远比笔译要高。AI 驱动的翻译能够以词对词的速度实时翻译人们的讲话,并且同时提供声音和字母,现在,机器可以翻译的语言有几十种。


但是,Jung还表示,AI 驱动的翻译也有一些积极的方面,它可以帮助人类翻译的发展。 “通过分析 AI 驱动的翻译的各种特征并确定其优缺点,翻译人员可以更有效地工作。翻译和口译院系需要积极主动地将AI驱动的翻译纳入课程。“他说。


未来,翻译会走向何方?Jung 的总结是,“个性化”和“创业思维”,当涉及高水平的语言,比如文学时,由于数据的缺乏AI 驱动的翻译可能不会做得那么好。翻译者应该强调自己的人性,在翻译中增加个性化的东西,增加翻译的可读性。


他说:“我们现在所处的时代,机器会不断地无情地拷问我们——你的工作有什么价值?它是否富有创造性?翻译员需要找一个新的方式来做贡献,这与此前有很大的不一样。

金准数据中国在线旅游度假行业研究报告 2017-06-06 10:45:04

一、中国在线旅游市场发展态势总论

中国在线旅游市场规模

在线旅游持续渗透,市场规模稳定增长。

数据显示,2016年中国在线旅游市场交易规模达5903.6亿元,增长率为33.3%,线上渗透率为12.0%,较去年相比提升1.3个百分比。

分析认为,尽管当前在线旅游行业进入稳定发展阶段,行业增长速度开始放慢,但在线旅游行业整体增长速度仍高于中国旅游业总收入增长速度,线上渗透率将保持增长,预计2019年线上渗透率接近15%。



中国在线旅游行业市场结构

机票占据半壁江山,度假占比逐步提升

.在线度假市场占比持续上升

中国在线旅游市场当中,度假交易额占比持续上升,2016年交易规模为974.4亿元,占比为16.5%,较2015年上升0.9个百分点。随着出境游、定制游的持续火热,在线度假占比将持续上涨。

机票市场仍占据半壁江山,但整体呈下降趋势

 2016年机票占比58.5%,其占在线旅游行业的比重较为稳定。机票是在线旅游市场中发展最为成熟的板块,随着在线度假及其他品类业务的上升,机票增速将相对放缓,比例出现下降趋势。

 .住宿市场占比较为稳定,中高端酒店及民宿产品受青睐

 2016年中国在线住宿占比为20.1%,较2015年下降0.2个百分点。在消费升级和中产阶级崛起的背景下,人们对出游的品质逐步提高,对住宿的需求也呈现个性化,因而未来中高端酒店及民宿等产品将逐渐受到用户的青睐。



中国在线旅游PC端流量数据分析

PC端流量呈现下滑态势

监测数据显示,2016年在线旅游行业PC端月度覆盖人数整体稳定在1.2亿人上下,各月同比增长率均为负值,整体流量呈现下降趋势。艾瑞分析认为,随着人口红利的消退,以及用户行为全面移动化,PC端流量未来仍将持续下降。



中国在线旅游移动端流量数据分析

红利消退,移动端流量趋向稳定

监测数据显示, 2016年在线旅游行业移动端月度覆盖设备数整体稳定在1.6亿台上下。其中,前11个月波度较小,12月受春运影响,月度覆盖设备数迅速增长至2.2亿台,增长率达25.8%。艾瑞分析认为,移动互联网目前已进入成熟阶段,易转化人群规模已经很小,因此在线旅游行业移动端流量趋向稳定。


中国在线旅游移动端流量数据分析

移动端访问次数占比六成,优势突显

监测数据显示,旅游用户在移动端的访问次数远高于PC端,移动端具有明显优势。2016年中国在线旅游移动端平均月度访次占比达60.4%,其中2月和12月移动端占比较高,均超过66%。艾瑞分析认为,移动端相较于PC端具有便携性,能够随时随地满足用户需求,因而能快速在用户人群中普及。


二、中国在线旅游度假市场分析

中国在线旅游度假市场定义

在线旅游度假定义及分类

.在线旅游

在线旅游是通过互联网、移动互联网及电话呼叫中心等方式为消费者提供旅游相关信息、产品和服务的行业。其包括在线机票预订、在线酒店预订、在线度假预订和其他旅游产品和服务(如商旅、保险、WiFi等)。

.在线旅游度假

在线旅游度假是指通过互联网、移动互联网及电话呼叫中心等方式为消费者提供旅游度假组合产品、单品门票及其他旅游出行相关产品和服务的行业。其按照旅游方式可分为在线跟团游和在线自助游两种形式。



中国在线旅游度假市场发展环境

2016年传统旅行社达2.8万家

公开数据显示,截止2016年底,中国传统旅行社共计28097家,增长率为1.7%,传统旅行社仍然保持缓慢增长状态。艾瑞分析认为,在旅游业中,线上渗透率还比较低,线下仍有非常广阔的空间,因此旅行社数量仍保持较为稳定的增长状态。同时,各大OTA为拓展三四线城市用户,纷纷尝试开设线下门店和体验店,征战线下市场,未来OTA和传统旅行社之间竞争将加剧。







中国在线旅游度假市场规模

2016年在线度假市场规模达962.9亿元

数据显示,2016年中国在线旅游度假市场交易规模为962.9亿元,较去年增长37.4%,占整体在线旅游市场的比重达16.3%,比2015 年提升0.1个百分点。分析认为,在线旅游市场中,在线度假市场发展最为迅速,其占在线旅游行业比重从2009年的5.8%,增长至2016年的16.3%。整体而言,在线度假市场前景广阔,预计未来几年增长率将保持在25%以上。



中国在线度假市场竞争格局

在线旅游度假市场格局稳定,途牛、携程双雄并立

数据显示,2016年中国在线旅游度假市场格局稳定,其中途牛、携程、同程依旧保持前三位置,市场份额分别为19.4%、19.2%和10.0%。分析认为,2016年在线旅游度假行业投资并购事件频出,市场竞争加剧,规模较小的企业份额被压缩。此外,飞猪、美团等平台发展也较为快速,推动平台模式市场交易规模占比提升。







三、中国在线旅游度假市场运营指标分析

中国在线旅游度假流量数据分析

携程月度覆盖人数领先,“双11”带动飞猪流量大增

监测数据显示,2016年中国在线旅游度假PC端主要网站月度覆盖人数整体较去年有所回落。除飞猪外的各主要网站月度覆盖人数变化基本趋势相似,在上半年波动增长,在Q3达到全年峰值,Q4流量呈下降趋势。飞猪流量波动较大,2月跌至全年最低值,11月份受“双11”影响,流量达到全年最高值。



中国在线旅游度假市场流量分析

飞猪访问次数领先,途牛缩小同去哪儿流量差距

监测数据显示,2016年飞猪流量波动较大,2月跌至全年最低值,11月份受“双11”影响,流量达到全年最高值。除飞猪外的各主要网站月度访问次数在上半年波动增长,在Q3达到全年峰值,Q4流量呈下降趋势。其中飞猪、携程及去哪儿流量领先,且同其他企业存在一定差距,为第一梯队。途牛月度访问次数呈逐月上升趋势,逐步缩小同第一梯队中去哪儿的流量差距。





四、中国在线旅游度假市场案例分析




五、中国在线旅游度假市场趋势分析