??xml version="1.0" encoding="utf-8" standalone="yes"?>
]]>
2、可以稍加改动成一个垂直搜索引擎;
3、可以提供搜索领域的ideaQ如果idea可行Q本人可以合作方式实现该ideaQ?br>4、可以提供整套服务,包括蜘蛛、分词、烦引、搜索服务;
郁闷Q感觉cppblog的h气不够,是不是考虑搬家到csdn呢?奇怪了cppblog删脓Q?
]]>
W者在本系列第一文章就提到QWeb 2.0 的商品只有一个,是「h」。然而,「h」要怎么h能变成商品?其实Q这个问题可以被化ؓQ有关h的资料,要怎么样生h值最后变成h|
当我们了解到QWeb 2.0 服务是以建立关系为核心之后,我们描述一个h的方法,会比 1.0时代要多元。D例说明,你在注册很多|站的用L户名Ӟ通常会要求你填写性别Q年龄,居住地甚臛_收入{等?/p>
q种可以用于l计上的资料Q网站经营者也会拿来做为经营的依据Q例如内容网站可以分析哪些频道是甚么Lq龄qQ电子商务网站可以分析不同性别用户的购物频率以及每ơ购物金额等{?/p>
然而有很多时候,|站l营者觉得这些资料还是不够细_他们恨不得每个用户都往自己头上贴标{,「我x白商品」,「我支持李宇春」,「我狂爱Nikeq动鞋」。每个用戯pQ就不用再瞎猜了?/p>
其实Q每个h都有很多q种标签。你现在可以做个小实验Q静下心来用q些标{来描述你自己,你可能可以写上一大叠。然而,你大概不知道你写的这一大叠标签其实价D城,有多h口水想要?/p>
惌hQ不惌知道Q其实你早就曝光。笔者说q,你在|络上收藏的书签Q你对自己写的Blog所下的标签Q其实都不是在描q「事情」,而是在描qC自己。你Q头上早p满了标签Q而且q召告天下?/p>
◎Web 2.0 是个庞大的hc资料挖掘器
透过每个Web 2.0 用户所贡献的内容以及标{,初步分析很容易就可以扑և「Nikeq动鞋潜在购买者」。这U资料,你说卖运动鞋的想不想要?Web 2.0 是个庞大的hc资料挖掘器?/p>
但是你会_q不是Google的Adsense 吗?用户的Blog上面只要有写到「运动鞋」的Q旁边的q告带出来跟运动鞋有关的广告。然而,Adsense 是给Blog访客看的Q我们说的却是Blog作者本人?/p>
你可能不知道Blog的访客是谁,只能因ؓ他刚好在看一跟q动鞋有关的文章播攄兛_告给他。而因U相x,所以还能期待著高达1%以上的广告点ȝ?/p>
然而,Z么不xq个Blog的作者已l写q?0跟q动鞋有关的文章Q因Z他下的标{ְ可以知道Q广告ؓ什么不直接投放l这些h看?或者针对这hQ直接帮Nikel营一个粉丝俱乐部Q?/p>
是庞大的Blog服务供应商,q样的资料越庞大。其实不是只有Blog QQ何的Web 2.0 服务例如分n相册Q分享书{{,甚至交友 |站Q都hq样的特性。你对h的资料挖掘越深,价值就高?/p>
然而,1.0 时代的用戯料统计,以及2.0 时代加上的「标{」分析法之外Q还有两个决定性的差异Q我们对h的h值挖掘进入了另一个层ơ。那是Q「心理素质」以及「行为素质」?/p>
◎心理素质的标签Q是下一个趋?/span>
你跟甚么LZ朋友Q说明了你可能也是那L人。「物以类聚,Z分」就是这个道理。此外,你在一个Web 2.0 |站上的zdQ可能也展现Z的活跃程度以及其他心理素质?/p>
q可能包含了你每个月拜访的Blog数量Q在别hBlog上留a的次敎ͼ所下标{U类{。因此Web 2.0 |站l营者可以在你的头上贴一个标{:「外向指敎ͼ 8」?/p>
同样的,q可以再_脓例如Q「积极指敎ͼ 6」「忧虑指敎ͼ 3」「压力指敎ͼ10」。笔者必L出,在强调以C会学ؓ基础U学所发展出来的Web 2.0 领域Q这cd理素质指数将会是重要的下一波!
q些指数与以往猜测用户互动行ؓ做ؓCl营的Web 2.0 有很大不同。首先他是能够把行ؓ量化的一U技术,其次q种技术需要深度的l合C会U学Q例如你怎么定义忧虑指数?/p>
最后,q种技术需要全新领域的演算Ҏ。换a之,目前搜烦引擎所赖以为生的PageRank计算ҎQ用于生某个网늚重要性指敎ͼQ是没有办法用在复杂的,以心理与行ؓ为基的,人的指数计算上?/p>
研究q种东西有什么用途?一个是更好的经营Web 2.0 所形成的社区,以这些指Cؓ依据做更好的互动引导。一个是更ؓ_ևq告投放。例如:试著投放「减压饮料」的q告l压力指数很大的用户Q?/p>
◎搜人引擎可做到_և营销
全世界顶的|络公司都已l开始意识到q个部分Q然而这隑ֺ实很高Q最明显的是展现在「数量」这件事情上。要帮一亿用户都打上q些心理素质标签Q要花多服务器Q要多久才能算完?
而在技术有重大H破之前Q有的网l公司先采用最单却最实用的方法上路了Q即W者之前提q的「搜人引擎」。目前在中国大陆已经有一家而且是唯一一家网l公司:Ucloo.com l营了近三年?/p>
创办者由于看C人的资料的h|而创立这间以技术ؓ核心的公司。每天透过E式在网l上蒐寻跟h有关的网,透过语意分析技术,属于同一个hQ却散落在各地的资料Q放在同一个h名下?/p>
你是不是在某个讨论区发过aQ你是不是曾l出现在大学录取的网l榜单?你是不是q在拍卖|站上留下过手机号和银行用户名?管你都是匿名,但是Ucloo.com 是有办法知道,q些资料通通都是你?/p>
你待q哪间公司,念过哪些学校Q你的同学和同事q有谁,你喜Ƣ什么明星,有没有小孩和房Q通通被蒐罗到名字下。运用你曄遗留在网上的公开资料QUcloo.com 已经在你的头上脓满了标签?/p>
Ucloo.com q不贩卖资料Q而是资料做为广告投放依据。例如某个广告主希望投放q告l大学刚毕业的社会新鲜hQUcloo.com 能精找hQ代为投放。经q实证,q告回应率远过传统|络q告?/p>
◎隐U顾虑VSLƲ望
搜h引擎在美国已l出现多q_L有十Ӟ除了d才刚拿到创投资金的Spock.com 以外Q每安已经营利。Spock.com 与Ucloo.com 的差别,除了中文与英文之外,最大的差别对资料来源的看法?/p>
Spock.com 要求注册Q而注册的时候要求你填入你在MSN QYahooQ, MySpaceQFacebook QFriendster{一堆社交网l服务的用户名和密码Q因Z们想这些用户名兌hQ以便知道这些资料通通属于你?/p>
W者在注册的时候,心中充满犹U和挣扎:「我Z么要让你知道q么多呀Q」他几乎问了我在Hotmail 以及Gmail 以及YahooQ的邮g帐号Q我q是一直问Q「做得也太过头了吧!?/p>
而Ucloo.com 采用的完全是搜烦引擎技术,包含有你的照片,有你讲话的媄片,完全从网上搜来。这两种资料取得Ҏ很难说谁好谁坏,但很昄Q用户对于「吐q资料」都是很挣扎的?/p>
用户心理很奇妙,每个人其实都不想被搜人引擎搜刎ͼ但是每个人来到搜人引擎,W一个动作都是搜索自q名字看看。(别骗我,在还没看完本文的时候,你已l偷偷去Ucloo.com 搜了你自q名字Q?/p>
q样的技术Google或微软难道不能做Q其实他们有钱有人,都能做的。然而,q显然跟PageRank那套法有关键差异,而且M一个搜人引擎其实都已篏U每个h的资料好多年了,从现在开始追QL慢了?/p>
◎本pd结?/span>
q个被吾友工头坚形容为石破天惊的「Web 2.0 再思考」系列,于本画下句炏V距ȝ者之前发布,正式承认自己错过Web 2.0 的那文章,刚y一q?/p>
q一q来Q我辛苦的摸索著Web 2.0 的样子,寚wq的评q行补修。最后呈现出来的q五文章,希望有达到可以毕业的水^Q甚臌有能力指Z点点势的方向?/p>
而在所有企业经营之外也希望大家xQ透过Web 2.0 Qh与h的联pL本比十年前更低,但是人心更加接近了吗Q或者每个h依然只是zd自己的圈圈,如笔者所_跟自己性质相同的一h互相取暖Q?/p>
我们所认知的世界,I竟是越来越宽广Q还是越来越狭隘Q我们所认识的自己,I竟是越来越清楚Q还是越来越模糊。会不会某一天,q告商比你还要了解你自己Q?/p>
不论哪种Web 2.0 |站都是以Ş成社Zؓ基础Q而社区其实就是小型社会。想要社会得以发展,l营者必L意h际互动方式的促进及规范。最l目标则是徏立用户间的「关p链」,否则用户注定待不久?
以社交网l服务(Social Networking Service Qؓ例,提供Blog以及相册服务Q仅仅是满了心理学安斯洛的「需求五层」当中的前两个层U,「存在的需求」而已?
在一个社会里每个人的需求都不同。有人只惛_个温饱,q不想与人发展出复杂的关pR对于社交网l服务经营者来_做好基础工具及功能,提供大容量的储存I间Q就已经满了这批h的需求?但是Zl究不能处在「遗世而独立」的状态,l营者必透过有意识的导引让h们找到可以对话的人。漂到荒岛上的人尽徏立家园却依然渴望dQ因为找不到人可以讲话的日子非常隄?
◎让每个更多的关?/span>
你可以在自己电脑上写日记Q但你选择在网l上写;你可以在自己览器理收录书签QBookmarkQ,但你选择在网l上攉。承认吧Q你其实惌被h发现。过dq已l证明,q种需求之巨大Q难以想像?
写Blog的h最l会因ؓ「没有h理会」而不再l书写。如果每文章底下都有h来留aQ长期写作的动力可大了。然而,qg事情要怎么h会发生?我们要问Blog服务l营者,你的「机制」是甚么Q?
有的Blog服务l营者靠著编辑推荐让某些Blogger 上台面被大家认识,而这只能照顾?%的h。于是,能让用户自力救济的服务出CQMyBlogLog 让Blog之间得以自然的串hQ因此增加互访的Z?
增加Blogger 之间的互访机会是l营者的责Q。最q很多Blog服务供应商开始引入「加为好友」机Ӟ好友一旦有更新的Blog文章你就会收到通知Q反之亦Ӟq让用户之间的自然互访机会大大提高?
q不得不让h佩服51.com以及日本Mixi之类服务l营者的眼光Q他们早在两q前已l在做这些事情。由于做C「让每个人都被别人理会」,用户在这里写Blog感觉人情味特别浓厚,最l能成其大?
◎虚拟胦产是自我实现的衡量标?/span>
然而,仅仅是被人理会,q样够了吗Q在一个社会中Qh人都有向上攀爬的Ʋ望。亦即马斯洛需求五层中的最高层U,自我实现的需求。尽成功者仅?%Q然而h人心中都渴望成功?
你如何获知自己成功?q是Web 2.0 的另外一个重点:q向成功的过E必要有篏U,q个累积必须要量化而且要被展示出来让h知道Q这是「私有胦产」的观念。其中,q可分ؓ有Ş财与无形胦产?
你写的Blog与上传的相片都是有Ş财Q无形胦产则可带入「信用」的概念Q亦卛_一个社会中被认可的E度。例如,C|站实行多年的积分及{制度Q就是一U被C成员公认的个Z用?
一个用户在Web 2.0 |站中的zd必须要篏U成财Q最后,除了在此地Ş成的关系链以外,用户q会因ؓq些虚拟财的篏U而再也无法离开。简单来_「搬家」变得困难?
然而,q些制度大部分没有被好好q用Q积分与{仅是无关重要的数字Ş了。经营者其实没有注意到Q适当刉「穷人」以及「阶U不q等」才是一个社区网站进步的关键Q而实体社会其实也是如此?
◎「阶U不q等」才能ɽC会q步
U分{制度塑造出一个Web 2.0 C中的「有׃h」跟「没׃h」。然而重点却是必让「有׃h」跟「没׃h」在同一个地方出玎ͼ展示其胦力造成ҎQ让他们彼此感觉到对方的财力以及I困?
只要「穷人」不会感觉到「这辈子要变有钱是没指望了」,׃Ȁ发他向上的欲望。很多有׃h最后投入公益事业是Z甚么Q因为看见世界上q这么多Ih。不透过「对比」,q些行ؓ׃会发生?
Z么我们不做一个「均富」的CQ要知道均富的概念仅是「胦产差异比较小」而不是「胦产大家一栗。适度的差异会造成Web 2.0 |站更加快速的发展Q而过大的差异则会造成「穷人」放弃希望?
换句话说Q当「穷人」不到哪里都跟他遇到一L「穷人」时Q他也就不觉得自己怎么惭愧Q激发不h动机。而当他走到哪里都遇到「有׃h」时Q他会觉得自己处在这个社会非常边~的角落?
q种Ҏ的掌握,有时候是说不清楚的一U艺术。掌握得好,甚至让某些社区服务的l营者大赚其钱。例如在韩国以及中国大陆大获成功Q在台湾却遇到较大挫败的Avatar服务?
◎营利关键也在「阶U不q等?/span>
众所周知QAvatar服务是让用户可以选择自己的头型发型眼睛E子衣服裤子甚臛_物,自由搭配l合p拟Ş象的一U服务。这些物件是要钱的,不愿意花׃的hQ系l会默认一套「遮布」给你?
Avatar服务的成功关键,在于其展C机会要多。用戯׃头像Q就是ؓ了展C己。如果曝光度不Q购买的意愿׃降低。这是「有钱,要让大家知道」的心理Q经营者首先必d造曝光机会?
花钱购买的h一定不是大多数。然而,当用户在M场合看到其他用户都只I一件「遮布」到处活动的时候,他也׃觉得自己I著「遮布」有甚么可耻,因此也生不起Q何想花钱购买Avatar的欲望?
能够成功掌握「恰到好处的穷Z有钱人展C在一起造成落差」,而且不会「因差过大造成Ih攑ּ希望」,以及「反正大安Ih也无所谓」的心理ӞAvatar服务大成功了?
q是Z么腾讯QQ的QQ Show 能大赚其钱,而台湾Yahoo!奇摩从韩国引q的Avatar服务多年Q却在前一阵子黯然收掉的主要原因。适当的造成「阶U不q等」,q且那U不q等适度展示出来才是促销关键?
◎h性,C会Q虚拟社区,道理一脉相?/span>
其实Q类似典范早已在|络游戏q种具体而微的虚拟社区经营上发生Q从「买点卡才能玩」过渡到「游戏免费玩但虚拟道兯钱」的模式。前者是均富Q后者是有钱人在游戏里可以买好道具当大爷?
吊诡的是Q一个阶U不q等的游戏ƈ没有吓跑玩家Q免Ҏ戏的同时在线人数屡创新高Q而放弃点卡月Ҏ入的游戏厂商Q卖虚拟道具赚得比以前还多。厂商的功力正在于对「阶U不q等」程度的拿捏?
一般而言Q以休闲׃Z的社区型态,例如游戏或者Avatar{,付费用户只要辑ֈ5%Q就可以是正常水^Q其馀不付费的用户占大多数。然而,我们能说「这剩下?95%用户我们不要Q把他们赶走」吗Q?
别忘了,q?%会付费的用户Q是花钱来消费这 95%不缴q用户的!没有了这 95%的免费玩Ӟ如何昄Z的虚拟胦产以及虚拟社会阶U?人性啊Q这都是人性!
或许你会认ؓQ网l游戏与Web 2.0 是两码子事。但W者的实战l验却是Qh性,C会Q虚拟社区,道理一脉相通,Ҏ是一回事。你可以说h性居然如此不堪,你也可以说正因如此所以社会不断进步?
◎Web 2.0 Q是׃h性所驱动的事?/span>
关于虚拟财的最后一个重点,财是必要被消耗的。积分与{不可无限增加Q当虚拟财有v有落Q有千辛万苦的篏U也有一掷千金的快感Ӟ那种「胦产」异常真实,用户从此再也M开你的C?
而经营者该做的事情是,定义Z的社ZQ哪些是用户的虚拟胦产,包含了有形与无Ş的。是所谓的z跃E度Q关p链的多寡?q是被其他h推荐的次敎ͼU分如何累积Q如何变成等U?
其次Q等U与U分该如何被展示Q被消耗,以创造真正的被拥有的价|让用戯然的感觉阶不^{的存在Q适当的呈现这U不q等以促q整个社会(CQ向上的动力Q进入正面@环?
Web 2.0 要赚钱,赚的都是q种人性心理的钱。而仔l的观察q个实体C会是怎么q作Q以及h心是怎么动的,对于l营Web 2.0 |站有绝对的帮助。Web 2.0 Q是׃h性所驱动的事业?/p>
「关pR是Web 2.0 当中唯一重要的事Q围l此核心的则是其建立与维持。然而,׃~Z对h性的认识Q某些社交网l服务已l陷入「提供工L用户建立关系Q但关系却怎么也徏不v来」的问题中?
最明显的例子,是v步甚早的C交|站Q或者称商务交友Q,例如联络家或者OpenBCQ现在已l改名ؓXing.comQ。此cL务以知名的六度空间理Zؓ基础Q锁定商务h士想要开拓h脉的需求而v?
我认识你Q你认识你的朋友Q而这些朋友又认识其他朋友。。。如果能这条关p鍊具体化,理论上我可以认识世界上Q何hQ而六度空间理论告诉我们,q些中间人的数量不会过六个?
使用q此cL务的人,刚开始可能兴奋于其快速接触大量陌生h的能力,q些人是你朋友的朋友Q也q全然陌生。然而以W者ؓ例,当我的联lh清单上已l聚集了过 200Z后,我就再也不想玩了?
一q多q去Q笔者发现这 200多h当中仅剩两三个活跃䆾子,大部分h都跟W者一P很久没上来用这个服务。商务h士急于拓展是高度被肯定的需求,然而这些hH然间冷掉了Q到底是怎么回事Q?
◎重新回惟뀌关pR是怎么建立与维持的
回想你现实的商务生活Q你会发现「h脉」是建立在利益之上的Q而利益则是徏{在有商业往来的前提下。回想你手上的名片簿Q你最常连l的N不是你的客户或者合作夥_你们有著共通的利益?
回想你曾l参加过的各式商务聚会,你交换到的大量名片,其中有多在事后Ҏ没l跟Ҏ联系Q有些h很勤奋的名片扫描归档,L数字化h脉管理,然而事后只能偶而{寄网l笑话给ҎQ?
让我们面对现实吧Q当你跟某个人没有生意可谈的时候,你跟他之间的关系是不会长久的Q「搭讪」是需要理qQh脉社交网站最大的问题在于搭讪的理由不Q以至于q后l的关系l持都很困难?
商务人士急功q利Q他们不会花旉在毫无意义的关系建立zd中。h脉网站上认识的连见都没见q,也没啥生意可谈的人,关系注定不会长久。光是处理实体世界的Q商务h士就已经忙不q来了?
有些|站发现用户变得不活跃,于是开始发展类似网l书{般的服务出来,让用h交新L者视频给其他人「顶」「推」。这实能帮助商务h士打发无聊上班时_但对于徏立关pȝ帮助是个问号?
◎拿到连l方式就{于建立Q?/span>
10q前W者曾l是知名的「记者会p蝶」,是I梭在行业聚会的人群中到处换名片的意思?0q后Q笔者参加类似的聚会永远只是低调安静的坐在角落,l束后默默离开?
q种场合q换到 100张名片都没用的,因ؓ跟这 100个h没有生意可谈。就把q些名片珍藏hQ哪天突然一个电话打q去Q对方也永远想不h他在哪里见过你。你需要的N是这Uh脉?
如果惌识特定的人,你永q可以找Ch帮你引荐Q而实际上完全不需要透过q种公开场合。反q来_x你谈生意的hQ也永远有办法找C。关键在于你们到底有没有生意可谈?
在公开场合中还有一U情景也很特D,你永q可以看C些小人物Ld急著跟大人物换名片。你想知道这些大人物们怎么处理q些被硬塞到手上的名片吗Q不Q你不会想知道的?
拿到q些大h物的名片Q你会{寄网l笑话给他吗Q不会。你会跟他谈价?0万元的小生意吗?不会。你会打手机跟他天南地北闲聊吗?不会。把他加?MSNQ你能确认回你信息的Z是他的秘书吗Q?
◎商务交友:先有商务才有交友
在h脉社交网站上Q上q情景依焉演。一h人在上面猛换名片Q一h人在上面惌识名人。说到底C交|站只是虚拟名片本。尽名单高?700个,却一个都没用Q跟你实体的名片本没有两栗?
|站上的各类用户Q呈现的是你经常在各大商务公开场合上看到的各种人的行ؓ的反映。而在公开场合中的C交行ؓQ对于关pȝ建立与后l维持其实效益是非常低的Q如果你们没有生意可谈?
很赤裸?是的。技术会演进Q然而h性却千古不变。Web 2.0 的创业家们有时候会做出功能 100分的|站出来Q却忘记「Web 2.0 其实是由人性所驱动的事业」,所有的功能都必d中h性的要害才行?
目前的h脉社交网站让用户可以分类理Q搜索想认识的hQ也可以透过已经认识的h与对Ҏ上线Q也有论坛可以让Z在网上交意见。问题是商务人士的关pd立与l持方式从来不是如此?
如果C交|站做不到协助用戗徏立关pR与「维持关pR,此类|站也不q就是空间无限的名片Ş了,谈不上甚么h脉。我们观察到Q在急功q利的商务交友这件事情上Q是先有商务才有交友的!
◎传l交友网站的瓉
C交|络服务可以U略分ؓ几种Q除了前面提到的商务交友Q还有传l交友,休闲交友以及婚恋交友{几U。其中,传统交友|站惛_你ƈ不陌生,此类|站?1.0时期已l存在?
最典型的,首页是一个醒目的搜烦引擎Q让你输入想L的对象是LQ女生,q龄Q所在地{。还可以依照学历Q兴嗜好等条gq阶搜烦。这也是一U目标非常精的|络C交zd?
然而,众所皆知Q传l的交友|站一直面临用户不断流失,以至于必长q编列广告预,惛_法不断去「买」新用户的局面。网站经营者已l很清楚Q每取得一个新用户的成本必花多少钱?
q是交友|站的宿命:单n男女来到此地Q花费两个月旉l识理想对象Q在取得Ҏ联系方式后就自然dq个|站。然而,交友|站里有更大一部䆾的hQ是׃两个月却一无所得,失望的离开?
典型的用戯为,是在注册完用户名Qƈ填入一堆自q兴趣爱好Q职业甚x入等资料后,搜烦「在该网站上已经有上传照片」的异性,凭著对照片的感觉开始向Ҏ打招呹{这U搭讪方式成功机率有多少Q?
◎「共鸣」,是让用户建立关系的第一?/span>
你在人潮Ҏ的闹区四处寻扑ֹ龄大U?5?0岁的奛_Q你心里对n高体重以及对斚w相自有一把尺。当l于发现合适的对象Ӟ一个箭步上前:姐我可以跟你交朋友吗?q种搭讪Q失败的机率极高?
然而,如果Ҏ爽快的答应,你接下来该怎么办?许多男孩子之所以惧于搭讪,不见得是x被拒绝Q有部分原因其实是更惧怕于「如果成功了Q接下来该怎么办」。这才是交友|站要面对的人性问题?
「搭讪」是需要理q。太q精的搜烦工具Q往往让h们忽略了「第一ơ开口之前需要培M么」。光凭著Ҏ的长相,出生日期Q年龄,兴趣职业{资料向Ҏ打招|Np保证一定获得回应?
q也是ؓ什么许多交友网站开始想著要提供Blog服务的原因,因ؓl营者发玎ͼ「单凭外在条件的_配对」其实ƈ不够。h与h之间能不能徏立关p,最l决定的不是q些外在条g?
事实上,心理的素质往往一切。问题是l营者如何展现每个用L心理素质Q提供Blog服务l用P让每个h上来写写日记吧!你在W一ơ开口搭讪之前,从对方的Blog最l能发现你与他是否有共鸣炏V?
「共鸣」,是让用户建立关系的第一步,也是长久l持关系的方法?
◎传l网l服务的关系建立议题
前些时候,有个长年l营在线学习|站的朋友询问笔者有关Web 2.0 的事情。由于感觉到q似乎是个趋势,他也惛_他的|站上引入社区相关的机制。除此之外,也有l营电子商务的网站的朋友来询问?
我们依然要看看「关pR!B2C 购物|站的购物者之间存在什么关p?有必要徏立关pdQ会因ؓ什么而开始第一ơ搭讪?建立h的是甚么关系Q能够长久维持吗Q?
「关pR,是Web 2.0 唯一需要思考的关键Q这件事情在在线学习的生意上也一栗其实在U学习的l营者会认ؓQ他们的服务是最适合建立学习C的。但是,没有看过太多以学习ؓȝ成功C出现?
我们一栯问,同样d某个老师上课的学员间Q是否有建立关系的必要?在什么情况下他们有徏立关pȝ需求?跟讲师之间是否需要徏立关p?能维持多久?q些关系铑֦果徏不v来,C׃可能出现?
同样的命题,我们q可以运用在很多地方再思考,例如Q在求职|站上寻扑cd工作的hQ彼此有建立关系的需求吗Q在|络上观看同一D媄片的人,彼此有徏立关pȝ需求吗Q如何徏立?又如何维持?
q不是所有的Web 2.0 服务都会走向交友服务。但是关pȝ建立与维持却是Web 2.0 赖以生存的基。而其实,多想想h与h之间的关pL如何产生的,以及背后的h性心理是甚么Q是很有帮助的?/p>
既然Web 2.0 的核心是CQ其时代议题与社会学有关Q我们不妨谈谈「上层社会」与「下层社会」的概念。这个概念之所以重要,是因两个阶层反映到Web 2.0 |站上,直接军_了网站的营利模式?
上述概念如果落实到工作性质上,则可两者以「白领阶U」与「蓝领阶U」两Un分概分;如果落实到年U上Q则可以两者以「非q轻人(特别指有工作者)」以及「年MhQ特别指学生Q」概分?
或许q样的分法无法满x些h士的挑剔Q但hW者不去讨Z格定义,毕竟q分的掉书袋于事无补Q而且怿字面上的意义大家都懂Q更因ؓq样的分cL在实际的观察中具体有用?
在现实社会里Q蓝领阶U和白领阶的交互性ƈ不高Q他们相互不在对方的交友圈子里。而年Mh则更常被当成Ҏ体对待Q成qh所担心的房贯RPq不是年Mh兛_的话题,消费习性也有很大差异?
C会阶层直接军_了你交友的范_有没有共通的话题成ؓ关键因素Q而话题又直接来自你日常所q的生活。这些习性成为摆׃掉的标签Q直接媄响到你会在Web 2.0 |站上与哪些阶层的hȀ荡v共鸣?
单的问:有没有Q何类似MySpace 的社交网站,是聚集社会上每个阶层的hQ进一步问Q既然Web 2.0 最l极的目标是建立ZZ间的关系Q那么虚拟世界是否可能打破这U壁垒,建立起交的可能Q?
◎社区,是一性质相同的h聚在一L互取?/span>
一个在某社交网站上开始写Blog的杂志编辑,今年刚过35岁,育有一子。在q个|站上不Ҏ扑ֈ跟她一样年U的人,使她非常的困惑。首上l常出现的帅哥美女照片如此年轻,使她老感觉走错地斏V?
她也始终搞不懂她写的育儿日记到底是谁在看。这些访客是真的有兴,q是只是不小心\q?偶而有人发了请求过来想要把她加为好友,一看对方简介是?8岁小LQ她也几乎不知道要跟他聊甚么?
怿q是很多人的共通经验:误闯某个阶层的聚集地Q喃喃自语一阵后d。正因ؓq种Ҏ,DWeb 2.0 |站的族特性鲜明。正如同W者在多年前所_CQ是一性质相同的h聚在一L互取暖?
「上层社会」与「下层社会」尽不怺交流Q但依然共存于同一个社会。对Web 2.0 |站l营者的挑战Q就是如何聚集不同阶层的人,之后准确的导引将他们分开QŞ成各自的圈子Q找到各自的归属?
然而这隑ֺ实在太高Q更多的Web 2.0 |站l营者有意识或无意识的选择了仅在某一个阶层做大做深,以至于深q影响了其l营型态以及营利模式。笔者将两个不同阶层的网民社会特性说明于下图Q?
举例Q类Dl家的h脉网站就是针对白领阶U。此cȝ站可以直接放弃跟用户收费的想法,因ؓ白领阶虽然较有钱,但一毛都不会花。付费能力跟付费意愿是两回事Q幸好,q群人广告主比较感兴?
◎社会阶层媄响营利模?/span>
正在阅读q篇文章的朋友,W者猜你qx在家或在公司上网Q而你很少有在|吧上网的经验。笔者更猜测你居住在大城市里Q例如北京或台北。而你其实不明白,大城市以外的人是怎么使用互联|的?
正是因ؓC会阶层的思考惯性,刉出一个市场空~。让我们看看台湾地区的Alexa |站排名Q会很意外发现有个ؓek21.com的网站叫做「寻梦园」,在排名上打|许多你所熟知的网站?
q个|站提供|络聊天室,语音聊天Q个人网,个h屋及头像(x谓Avatar服务Q,能赚q服务一h。再仔细看看上面z跃的用P都是一你不熟悉的人,侍者,司机Q打工妹Q中南部乡亲?
在Web 2.0 创业|站如雨后春W般冒出来之际,q间公司已经静悄悄的赚钱?Nq。他的收入来源很单,是对用L接收贏V当Ӟ不付费的Z定占大多敎ͼ但是付费的比例以让他存zȝ臛_赚?
很难惛_Q正因你是一毛不拔的白领Q所以很隄解下层社会的付费习惯。这h是冲动消费的Q赚q群人的p三块׃块钱的赚Q只要服务够让h动心卛_薄利多销。虽Ӟq告dq群Z感兴?
下层C会是h数可观的阶层Q在中国大陆市场情况更是如此。而下层社会的存在更直接造就了营利可观的巨大互联|公司,例如腾讯。这间公司拥有四亿多个用户名敎ͼ营利来源大部分来自跟用户收费?
◎下层社会的消费习?/span>
若你l营的Web 2.0 |站上大部分用户是「下层社会」的人(例如学生Q年MhQ,而你使尽吃奶力气想从q告获利Q那W者只能说Q你遗失掉了一大块收入Q而你自己q不知道Q跟用户收费的收入?
能够跟用L接收费的服务有哪些?腾讯及寻梦园已经玩一遍给你看了。收费的重点在于虚拟服务Q而绝非透过电子商务销售实体物品,那是q反Web 2.0 天性的赚钱Ҏ。Web 2.0 要赚的是人际互动的钱?
你想知道你所不熟悉的另一个阶层的人在做什么吗Q玩玩网l游戏吧Q笔者有q在几年前玩q风靡一时的游戏「传奇」,l识了我一辈子都不会有Z认识的卡车司机,槟榔西施Q家庭主妇,黑帮大哥?
q些人很多没有电子邮件用户名Q上|地点在|吧Q不知道孤狗是什么,从不?MSN。最q|络zd是游戏与聊天。套一句台湾流行的话,q是台客与台妹的市场Q是一个你无法惛_的市场?
在中国大陆的市场也是一L。最q大的用L体是q轻人,学生Q是民工Q是二线城市的居民。这些h上网的地Ҏ|吧Q而网吧里有游戏有电媄有机会跟帅哥女|络聊天Q每时只要一块钱人民币?
在娱乐资源匮乏的二线城市Q这是他们唯一消费得v的文化娱乐活动。Q何Web 2.0 |站只要占住q个q大的下层社会就发了。尽工资水q不高,q些人对|络服务的付费冲动以及付q速度奇快无比?
◎打破菁英阶层的藩篱
Web 2.0 的创业家们所能创造出来的C型态,很大一部分是由于其所存在的社会阶层所军_。大部分人无法去做另外一个社会阶层的生意。他们无惛_Q就想C也做不好Q因为那不是他们的生zR?
然而,许多 2.0创业家把自己兛_更小的圈子。笔者曾跟某|络公司创业者说Q(贵公司)l箋l持q种_英份子的氛围是有害的,要不要试著做一个被部落圈唾骂,然后在大众市场广受欢q的产品出来Q?
相较于美国上亿的|络人口Q一个网l书{֏要有 100个h「推」「顶」,可以站上美国知名网l书{del.icio.us 的首c这是「假民主」,只是菁英份子在自q圈圈里玩ѝ?
RSS QTag QTrackback QWikiQWidgetQ这些上层社会中的菁英阶U创造出来的玩意Q真是他妈的见鬼了。笔者四q前接触Web 2.0 技术文Ӟp得这些东西应该送进坟墓里去Q一般h实在太难理解了?
而这些玩意儿在用上的困隄度,虽然不是刉虚拟社会群体间围墙的凶手,却是加大加高那堵围墙的推手。这些工h圈v来的是更菁英更小的圈子,而普|大众是从来搞不懂的?
无法拥抱大众阶层的东西,营利多少会受到限制。这些技术还非常原始Q不「上层社会」或「下层社会」的|民Q接受程度非常有限。让Web 2.0 更容易用些Q把q些东西藏v来或包装成易开|吧Q?/p>
首先QWeb 2.0 不是媒体Q然而很多Blog|站l营者仍然在做「内容出版」(Content PublishingQ的生意。传l新ȝ站靠~辑来做出版Q现在则是把内容供应的Q务丢l众多写Blog的h?
举例Q博客中国可以说是中国Blog的先行者,但是l营多年q是M开「找人来写专栏」的模式。用户在上面所q行的行为,是内容览Q网站依然是以「内宏Vؓ核心的呈现型态,?.0 没甚么差距?
Web 2.0 不就是由用户参与提供内容的草根媒体吗Q怎么说跟内容无关Q笔者感觉:1.0 的内Ҏ「以内容览为目的」,而Web 2.0 的内容则是「以关系建立为目的」,内容只是用来建立关系的工LŞ了?
a之,1.0 时代的商品是「信息」,所有发展都围绕在「如何处理信息爆炸」,不论新闻|站q是搜烦引擎。而Web 2.0 时代的商品则是「关pR,议题是「如何处理关pM뀍及「如何处理关pȝ炸」?
更简单说QWeb 2.0 的商品只有一个,是「h」?.0 时代Q我们需要内容专家来帮我的经营早期的|络公司QWeb 2.0 时代Q我们需要的则是C会学家Q指引我们如何引gh们在虚拟C会中互动?
◎Q何hQ都有「被发现」的需?/span>
1999q_W者Q职的|络公司找来图书馆系毕业的hQ专司搜索引擎分c;找来报纸杂志的编辑,专司内容频道Q由于那个时代完全专注在信息处理的议题上Q所以我们需要这L专才?
Web 2.0 时代Q网站服务的l极目标Q将会围l在「如何展C个h」这件事情上。谈ChQ我们无可避免要谈到人的需求。著名的心理学家马斯z曾指出人的需求有五个层Q由基本到高阶分别是Q?
1)生理的需求;2)安全的需求;3)被接U的需求,或爱与归属的需求;4)自尊的需求;5)自我实现的需求。其中,前两者笔者将之简单的UCؓ「存在的需求」,而后两者笔者称为「社交的需求」?
上q层U{换到互联|,会发现Blog甚至|络相簿{服务,仅满_在的需求。换a之,|民书写Blog及上传相片的行ؓQ不应该被视为「个人出版」,而应被视为「嘿Q我在这里!」的一U宣告?
|民需要在|络上有个地方宣告自q存在Q那里是她的Ӟ是心늚港湾Q是休憩的地斏V那个地方要能安全的存放Ҏ有的一切,她在上面的一切痕q,包含相簿Q日讎ͼ留言Q都是存在的证明?
问题来了Q绝大部份写Blog的h在网l上都是孤独的存在著。他们的 Blog有人光,每个月拜访者仅Ch。一个不断发出「嘿Q我在这里!」讯息的人,在长久没被发现的情况下,注定要孤独的老去?
◎Web 2.0 下一阶段Q关pȝ建立与管?/span>
许多Blog服务l营者已l发现此c问题,开始朝向下个阶D|q:卟뀌社交的需求」。每个h都期待被发现与被接纳Q你如何导引Z互相认识Q搭讪是需要理qQ而所有的内容都可能成为搭讪的理由?
在美国有 MyBlogLog之类的服务,让写Blog的h可以看到有谁来过我的Blog。而中国的Blog服务l营者,则乾脆将其他人的来访记录变成 Blog基本功能Q每个h都可以看到谁来过我的Blog?
q已l与「个人媒体」无养I而是我们有意识的在导引著Z人间的关pd立。你看到有h来访于是你回访她的BlogQ关pd立的W一步于焉开始。好的Blog服务l营者,应该做到透过各种手段让关pd生?
有的Blog服务l营者,透过内容推荐的方式将好的Blog文章推送到首页Q或者透过~辑推荐Q或者透过其他读者「顶」「推」。然而这除了?.0 时代「内容出版」没两样外,也不q是创造出5%的明星Ş了?
「让每个人都有机会被自然的关注」,是Blog服务l营者的责QQ也是类似日本Mixi及中?1.com成其大的原因。经营者很早就体悟Blog 跟内容出版无兟뀂Blog仅是存在的基Q必d此之上完成社交工作?
而新博客的「生产明星」工作,仅是创造少数明星及满大众凑热闹心态。绝大部分在上面开博的个h很少被理会,Blog乏h问|。明星仅是创造内容及量的工Pq不是Web 2.0 Q而是1.0 内容|站?
◎「ؓ了分享而分享」,从来不存?/span>
套用马斯z的理论看v来很玄,但是q样的架构却能用来检视不同类型的Web 2.0 |站Q而看出未来发展潜力。简a之,q几个层ơ的需求必M层层满Q无法抄快捷方式。抄快捷方式者注定要在发展上遇到瓉?
目前有很多Web 2.0 |站设计之初想到要搭徏一个架构让用户上来「分享」。分享的内容则从书签Q新闻,艺文zd讯息Q美食评鉴到折扣信息{不一而。然而,分n者却L很少?
q些l营者可能没惌Q分享ƈ不是自然会发生的行ؓ。hQ一定是先考虑完自己,才会考虑别h。因此网站的初期功能一定是先满了自己「存在的需求」,为己所用,接下来才考虑分nl别人的问题?
以社会性书{站(Social Bookmark Q例如美国del.icio.us Qؓ例,首先考虑|络书签功能是否满个h整理信息的工h需求,接下来才有分享给别h的需求。最后,透过适度导引让h们进行互动?
|络书签q让众人鼓噪把一则网址推上首页的闹市,而是Z人徏立关pȝ工具。用h集的书签以及对书{所下的 TagQ是「对自己的描q」,重点不在内容Q而是透过那些内容Q他们表明了他们是谁?
当对「h」的描述完成后,要让他们建立关系׃难了。Web 2.0 |站l营者可用Tag 为核心,Data Mining 为手D,做到让性质相同Q相异的人有更多认识Z。以此观之,|络书签未q入下一阶段?
◎搜索引擎的下个阶段议题
上面提到的经营方式,都在描述如何处理「关pM뀍的问题。然而,另一个问题在Web 2.0 时代也更加凸显,卟뀌关pȝ炸」的问题。当你加入的Web 2.0 |站多了Q关p链的管理将十分手?
W者曾说过在Web 2.0 时代Qh与h联系的成本将于更低。然而,众多的Web 2.0 |站在引入关p鍊的概念后Q却D要精的扑ֈ某一Uh甚至某一个hQ变成成本很高的行ؓ?
例如Q在国x一个hQ你可能得逛逛MySpace Q或者Orkut Q或者FacebookQ接下来q有成千上百个Web 2.0 |站。就不是精的扑և一个h而是某一UhQ例如:明朝历史爱好者)也是困难的事情?
q是新时代的搜烦引擎所应当要处理的问题Q关p链的搜索?.0 时代我们看见了信息爆炸时Q取得精信息的高成本,而搜索引擎成功的解决了这个问题。现在,关系爆炸Q成为另一个需要解决的问题?
GBK
范围Q?0×8140 - 0xFEFE
GB2312-80 仅收汉字 6763 个,q大大少于现有汉字,随着旉推移及汉字文化的不断延推广Q有些原来很用的字Q现在变成了常用字,例如Q朱鎔基?#8220;?#8221;字,未收?GB2312-80Q现在大陆的报业出刊只得使用Q金+容)、(金容Q、(左金叛_Q等来表C,形式不一而同Q这使得表示、存储、输入、处理都非常不方 便,对于搜烦引擎{Y件的构造来说也不是好消息,而且q种表示没有l一标准。从我们对h民日?98 q数据的处理q程中,得出q样的经验:回填外字最困难的就是如何得到这U表C方法的集合?
Z解决q些问题Q以及配?UNICODE 的实施,全国信息技术化技术委员会?1995 q?12 ?1 日《汉字内码扩展规范》。GBK 向下?GB2312 完全兼容Q向上支?ISO-10646 国际标准Q在前者向后者过渡过E中起到的承上启下的作用?
GBK是GB2312-80的扩展,是向上兼容的。它包含?0902个汉字,其编码范围是0×8140-0xfefeQ剔除高?×80的字位。其所有字W都可以一对一映射到Unicode2.0?
字集
GBK 共收?1886个汉字和囑ŞW号Q包括:
GB2312 中的全部汉字、非汉字W号?br>BIG5 中的全部汉字?br>?ISO-10646 相应的国家标?GB13000 中的其它 CJK 汉字Q以上合?20902 个汉字?br>其它汉字、部首、符Pp 984 个?br>GBK ~码区分三部分:
汉字?包括
GBK/2QOXBOA1-F7FE, 收录 GB2312 汉字 6763 个,按原序排列;
GBK/3QOX8140-AOFEQ收?CJK 汉字 6080 个;
GBK/4QOXAA40-FEAOQ收?CJK 汉字和增补的汉字 8160 个?br>囑ŞW号?包括
GBK/1QOXA1A1-A9FEQ除 GB2312 的符号外Q还增补了其它符?br>GBK/5QOXA840-A9AOQ扩除非汉字区?br>用户自定义区
?GBK 区域中的I白区,用户可以自己定义字符?br>R碼
GBK 亦采用双字节表示QM~码范围?8140-FEFE 之间Q首字节?81-FE 之间Q尾字节?40-FE 之间Q剔?XX7F 一条线?
?软公司自 Windows 95 体中文版开始支?GBK 代码Q標準叫法是 Windows codepage 936Q也叫做 GBKQ國標擴展)Q它也是 8-bit 的變L{據我所?GBK 從來沒成爲過正式的國家標準,只不過因?Windows 的普及,它已E成爲事實上的標準了。但目前的多数搜索引擎都不能很好地支?GBK 汉字?
由前电子部科技质量司和国家技术监督局标准化司?995q?2月颁布的指导性规范。(GBK?K?#8220;扩展”的汉语拼音第一个字?
GBK作ؓ?UCS ( ISO/IEC 10646 ) 体系的代码页Q适用于中文信息的处理、交换、存储、传输、显现、输入和输出?br>GBK 与国家标?GB 2312-80 信息处理交换码所对应的、事实上的内码标准兼容;同时Q在字汇一U支?ISO/IEC 10646-1 和GB 13000-1 的全部中日韩 (CJK) 汉字(20902?。GBK除了包含GB2312-80 和GB12345-90中包括的全部非汉字符号外Q还늛我国台湾地区中文标准交换码TCA-CNS 11643 -92 ( 与其对应的内码ؓBig5Q以下用Big5泛指二者? 中的l大多数W号?br>从Windows95中文版vQWindows NT 3.51, 4.0, Windows2000, Windows CE, Linux已经全面支持GBKQvC从GB 2312向Unicodeq渡的承上启下的重要作用?br>GBK管在字汇一U支持CJKQ是目前最大的Code Page Q它在体pȝ构、代码空间上Q仍然是完全不同于ISO/IEC 10646 和Unicode的?
BIG5
范围Q?0xA140 - 0xF9FE, 0xA1A1 - 0xF9FE
Big5是台湄IIIT1984q发明的,CNS 11643-1992( Chinese National Standard)
是扩展版?主要大家用的q是big5
每个字由两个字节l?成,其第一字节~码范围?xA1~0xF9Q第二字节编码范围ؓ0×40~0×7E?xA1~0xFEQ总计收入13868个字 (包括5401个常用字?652 个次常用字?个扩充字、以?08个各式符?
GB18030:
GB18030-2000(GBK2K)在GBK的基上进一步扩展了汉字Q增加了藏、蒙{少数民族的字Ş。GBK2K从根本上解决了字位不够,字Ş不的问题。它有几个特点:
它ƈ没有定所有的字ŞQ只是规定了~码范围Q留待以后扩充?
~码是变长的Q其二字节部分与GBK兼容Q四字节部分是扩充的字Ş、字位,其编码范围是首字?×81-0xfe、二字节0×30-0×39、三字节0×81-0xfe、四字节0×30-0×39?
它的推广是分阶段的,首先要求实现的是能够完全映射到Unicode3.0标准的所有字形?
它是国家标准Q是强制性的?/p>
补充Q?/p>
中文信息~码标准Q常用的是GB2312-1980QGB12345QGB13000QGBKQ,
以及最新标准GB18030?/p>
GB2312的汉字编码规则ؓQ第一个字节的值在0xB0?xF7之间Q第
二个字节的值在0xA0?xFE之间?/p>
GB12345和GB13000是对GB2312-1980的扩充,所有已l包含在GB2312
中的汉字~码不变Q另外增加更多的码位。其~码规则大致为:W一
个字节的值在0×81?xFE之间Q第二个字节的值在0×40?xFE之间?/p>
GB18030 是最新的汉字~码字符集国家标? 向下兼容 GBK ?GB2312 标准?br>GB18030 ~码是一二四字节变长~码?一字节部分?0×0~0×7F ?ASCII
~码兼容?二字节部? 首字节从 0×81~0xFE, ֭节从 0×40~0×7E 以及
0×80~0xFE, ?GBK标准基本兼容?四字节部?
W一字节?0×81~0xFE, W二字节?0×30~0×39, W三和第四字节的范围和前
两个字节分别相同?四字节部分覆盖了?0×0080 开? 除去二字节部分已l?br>覆盖的所?Unicode 3.1 码位。也是? GB18030 ~码在码位空间上做到
了与 Unicode 标准一一对应,q一点与 UTF-8 ~码cM?/p>
UTF_8字符?/p>
UTF-8是UNICODE的一U变长字W编码,由Ken Thompson?992q创建。现在已l标准化 为RFC 3629。UTF-8??个字节编码UNICODE字符。如果UNICODE字符?个字节表C,则编码成UTF-8很可能需?个字节, 而如果UNICODE字符?个字节表C,则编码成UTF-8可能需?个字节。用4个或6个字节去~码一个UNICODE字符可能太多了,但很会遇到 那样的UNICODE字符?/p>
Hong Kong GCCS是香港政府ؓbig5加的3049个字,(Government Chinese Character Set)
香港增补字符?HKSCS)是后来的标准,包括了Big5和ISO10646的编?所以HKSCS的big5
版是补充了GCCS的增强版,ISO10646是UCS(universal character set),ISO是政府组l?br>Unicode是电脑业界组l?不过UCS和Unicode的字库一?/p>
~码字数l计:
GB2312 6763个汉?br>GB12345 6866个汉?br>GBK 21003个汉?br>GB18030 27000个汉?br>Big5 13053个汉?br>CNS11643 48,027个汉?br>
1.1 数据挖掘技术的基本概念
随着计算机技术的发展Q各行各业都开始采用计机及相应的信息技术进行管理和q营Q这使得企业生成、收集、存贮和处理数据的能力大大提高,数据量与日俱增。企业数据实际上是企业的l验U篏Q当其积累到一定程度时Q必然会反映律性的东西Q对企业来,堆积如山的数据无异于一个巨大的宝库。在q样的背景下Qh们迫切需要新一代的计算技术和工具来开采数据库中蕴藏的宝藏Q其成为有用的知识Q指g业的技术决{和l营决策Q企业在竞争中立于不|之地。另一斚wQ近十余q来Q计机和信息技术也有了长的进展,产生了许多新概念和新技术,如更高性能的计机和操作系l、因特网(intemet)、数据仓?datawarehouse)、神l网l等{。在市场需求和技术基q两个因素都具备的环境下Q数据挖掘技术或UKDD(KnowledgeDiscovery in DatabasesQ数据库知识发现)的概念和技术就应运而生了?/span>
数据挖掘(Data Mining)旨在从大量的、不完全的、有噪声的、模p的、随机的数据? 提取隐含在其中的、h们事先不知道的、但又是潜在有用的信息和知识。还有很多和q一术语相近似的术语,如从数据库中发现知识(KDD)、数据分析、数据融?Data Fusion)以及决策支持{?/span>
1.2 数据挖掘的基本Q?/span>
数据挖掘的Q务主要是兌分析、聚cd析、分cR预、时序模式和偏差分析{?/span>
1. 兌分析(association analysis)
兌规则挖掘由Rakesh Apwal{h首先提出。两个或两个以上变量的取g间存在的规律性称为关联。数据关联是数据库中存在的一c重要的、可被发现的知识。关联分为简单关联、时序关联和因果兌。关联分析的目的是找出数据库中隐藏的兌|。一般用支持度和可信度两个阀值来度量兌规则的相x,q不断引入兴度、相x等参数Q得所挖掘的规则更W合需求?
2. 聚类分析(clustering)
聚类是把数据按照怼性归Ux若干cdQ同一cM的数据彼此相|不同cM的数据相异。聚 cd析可以徏立宏观的概念Q发现数据的分布模式Q以及可能的数据属性之间的怺关系?/span>
3. 分类(classification)
分类是扑և一个类别的概念描述Q它代表了这cL据的整体信息Q即该类的内涉|qͼq用q?span> U描q来构造模型,一般用规则或决{树模式表示。分cL利用训练数据集通过一定的法而求得分c规则。分cd被用于规则描q和预测?/span>
4. 预测(predication)
预测是利用历史数据找出变化规律,建立模型Qƈ由此模型Ҏ来数据的U类及特征进行预?span> 预测兛_的是_ֺ和不定性,通常用预方差来度量?/span>
5. 时序模式(time-series pattern)
时序模式是指通过旉序列搜烦出的重复发生概率较高的模式。与回归一P它也是用q的数据预未来的|但这些数据的区别是变量所处时间的不同?/span>
6. 偏差分析(deviation)
在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库中数据存在的异常情冉|非常重要的。偏差检验的基本Ҏ是L观察l果与参照之间的差别?/span>
1.3 数据挖掘常的基本技?/span>
1. l计?br> l计学虽然是一?#8220;古老的”学科Q但它依然是最基本的数据挖掘技术,特别是多元统计分析,如判别分析、主成分分析、因子分析、相兛_析、多元回归分析等?/span>
2. 聚类分析和模式识?br> 聚类分析主要是根据事物的特征对其q行聚类或分c,x谓物以类聚,以期从中发现规律和典型模式。这cL术是数据挖掘的最重要的技术之一。除传统的基于多元统计分析的聚类Ҏ外,q些q来模糊聚类和神l网l聚cL法也有了长的发展?/span>
3. 决策树分cL?/span>
决策树分cLҎ不同的重要特征,以树型结构表C分cL决策集合Q从而生规则和发现规律?/span>
4. 人工经|络和遗传基因算?/span>
人工经|络是一个迅速发展的前沿研究领域Q对计算机科?人工、认知科学以及信息技术等产生了重要而深q的影响Q而它在数据挖掘中也扮演着非常重要的角艌Ӏh工神l网l可通过CZ学习QŞ成描q复杂非U性系l的非线性函敎ͼq实际上是得C客观规律的定量描qͼ有了q个基础Q预的N׃q刃而解。目前在数据挖掘中,最怋用的两种经|络是BP|络和RBF|络 不过Q由于h工神l网l还是一个新兴学U,一些重要的理论问题未解决?/span>
5. 规则归纳
规则归纳相对来讲是数据挖掘特有的技术。它指的是在大型数据库或数据仓库中搜索和挖掘以往不知道的规则和规律,q大致包括以下几UŞ式:IF … THEN …
6. 可视化技?/span>
可视化技术是数据挖掘不可忽视的辅助技术。数据挖掘通常会涉及较复杂的数学方法和信息技术,Z方便用户理解和用这cL术,必须借助囑Ş、图象、动ȝ手段形象地指导操作、引导挖掘和表达l果{,否则很难推广普及数据挖掘技术?/span>
1.4 数据挖掘技术实施的步骤
数据挖掘的过E?/span>可以分ؓ6个步骤:
1) 理解业务Q从商业的角度理解项目目标和需求,其转换成一U数据挖掘的问题定义Q设计出辑ֈ目标的一个初步计划?/span>
2) 理解数据Q收集初步的数据Q进行各U熟悉数据的zd。包括数据描qͼ数据探烦和数据质量验证等?/span>
3) 准备数据Q将最初的原始数据构造成最l适合建模工具处理的数据集。包括表、记录和属性的选择Q数据{换和数据清理{?/span>
4) 建模Q选择和应用各U徏模技术,q对其参数进行优化?/span>
5) 模型评估Q对模型q行较ؓd的评Pq检查构建模型的每个步骤Q确认其是否真正实现了预定的商业目的?/span>
6) 模型部vQ创建完模型q不意味着目的结束,即模型的目的是Z增进Ҏ据的了解Q所获得的知识也要用一U用户可以用的方式来组l和表示。通常要将zd模型应用到决{制订的q程中去。该阶段可以单到只生成一份报告,也可以复杂到在企业内实施一个可重复的数据挖掘过E。控制得到普遍承认?/span>
1.5 数据挖掘的应用现?/span>
数据挖掘是一个新兴的边缘学科Q它汇集了来自机器学习、模式识别、数据库、统计学、h工智能以及管理信息系l等各学U的成果。多学科的相互交融和怺促进Q得这一新学U得以蓬勃发展,而且已初兯模。在国国家U学基金?NSF)的数据库研究目中,KDD被列?0q代最有h值的研究目。h工智能研I域的U学家也普遍认ؓQ下一个h工智能应用的重要N之一Q将是以机器学习法Z要工L大规模的数据库知识发现。尽数据挖掘还是一个很新的研究NQ但它所固有的ؓ企业创造巨大经效益的潜力Q已使其很快有了许多成功的应用,h代表性的应用领域有市场预、投资、制造业、银行、通讯{?/span>
国钢铁公司和神户钢铁公司利用基于数据挖掘技术的ISPApȝQ研I分析品性能规律和进行质量控Ӟ取得了显著效果。通用电器公司(GE)与法国飞机发动机刉公?sNEcMA)Q利用数据挖掘技术研制了CASSIOPQEE质量控制pȝQ被三家Ƨ洲航空公司用于诊断和预渡?37的故障,带来了可观的l济效益。该pȝ?996q获Ƨ洲一{创造性应用奖?/span>
享有盛誉的市场研I公司,如美国的AQCQ一Nielson和Information ResourcesQ欧z的GFK和lnQfratest Burk{纷U开始用数据挖掘工h应付q速增长的销售和市场信息数据。商家的Ȁ烈竞争导致了市场快速饱和,产品的迅速更斎ͼ使得l营者对市场信息的需求格外强烈利用数据挖掘技术所形成的市场预能力和服务Qɘq些市场研究公司取得了巨大收益?/span>
英国q播公司(BBC)也应用数据挖掘技术来预测电视收视率,以便合理安排电视节目时刻表。信用卡公司Alllelicall KxT,ress自采用数据挖掘技术后Q信用卡使用率增加了10Q?一15Q。AT&T公司赁借数据挖掘技术技术侦探国际电话欺诈行为,可以快发现国际电话使用中的不正常现象?/span>
中国的公安部门也在研I利用KDD技术ȝ各类案g的共性和发生规律Q从而在宏观上制定最有效的社会治安综合治理的Ҏ和措施;在微观上指出犯罪人的特点Q划定罪犯的范围Qؓ侦破工作提供方向?/span>
|
关键词一Q分?/p>
q个词已l被分众传媒实践Q我当时赯个公司名字的时候来自托夫勒的第三次潮Q他比较多的用了个性化、分众化、碎片化Q我后来拿来做分众传?公司的名字。大家看?#8220;分众”q个词已l成为生zȝ状态,1992q以前中国不需?#8220;分众”q个词,大家彼此之间没有太多的区别,只有职业或岗位不同的?分。到?998q我们看到整个社会发生巨大的改变Q社会各U各L人群和商品出现细分化的趋势,必然D了传播领域的l分化。所以客户一直要求用更精?的手D|中和打动他所惌的目标受众,避免q告费的费。于是我们看到手机、房产、汽车越来越有受众分层的象征Q如果说普通的牛奶是纯牛奶的话Q那酸奶?表更加年L的阶层Q特伦苏代表比较中高档的阶层。我惌个社会细分化的趋势值得大家重视Q未来的媒体一定是由大众向分众转变。我x来的手机媒体、搜 索引擎都慢慢预示着一对一媒体的到来,q是我们看到的第一个关键词?/p>
关键词二Q植?/p>
大家很清晰看到各U植入式的力量。对于电视节目片中插播的q告恐怕没有多h能够记得Q一到广告{台率qU上升。但我们看到蒙牛在超U女声成 功是用了植入的力量,消费者只要消费内容不看广告,q时候只有让q告成ؓ内容的组成部分的时候才不让q告被忽视。当所有的东西Q主持h、背景台{等被综?调用h的时候,你很隑֛避,因ؓq告植入在内容当中,成ؓl成部分。包括现在很多的行销当中采用公关的力量,有的人控制博客、BBSQ在|络上也好,?新闻上也好,采用的这些更加自我体验的模式d造对q个品牌信赖度的感觉也成为目前植入式q告的重要词语?/p>
关键词三Q娱?/p>
在未来世界的行销当中大家需要考虑如何把广告植入到׃当中Q有几个方向可以看到Q第一是在音乐行销斚wQ比如说最明显的案例,ASK FOR MOREQ王菲唱的百事可乐的歌,当它在电台被反复播放的时候百事可乐的形象得C传播。这些广告和音乐׃的东西完全整合在一P很难忽视它的存在Q?只要你热p个歌星媄星就被卷入其中。第二是体育营销Q三星也好、联想也好,在体育行销中的表现和收获大家看得到Q可以看到欧z球付贚w道的存在Q像?谊兄弟这U电视公怸断把q告卷入其中。第三,国外IN GAME的广告,在赛车当中有一块\牌是Intel的广告,在植入式游戏当中的体验更加认可,所以我惌个是未来大家可以看得到的方向?/p>
关键词四Q体验式行销
比如宜家Q它有很多床、沙发,投媄机打在屋上Q大家可以h在那边,一边体验宜家的舒适放松,一边获得宜家所要讲的感受。所以我怿像宜家这U体验式会成为未来很多行销的主要导向?/p>
关键词五Q垂?/p>
现在门户|站的市场在l箋上升Q以新浪Z表每q的q告收入呈现高速度的增ѝ同时也看到垂直|站的崛PcM东方财富|,作ؓ中国最大的财经 门户|站Q从量角度来说Q我上次上去看到一博?万h读,专业人员的这U杀伤力会越来越强。这U垂直的|站不单是网站,它可以做得更加深入和深刻Q把 上下业链打通。不仅成为最专业的网站,把它延到操盘密码的股票软gQ这U上万元一个的软gQ可能最后开发出来的成本已经几乎为零了,一天如果可以卖 ?00套的话,q个我觉得收入是非常恐怖的。所以我想类DU垂直性的|站是垂直打通它所在的C和专业领域,收入是多元化的,以后会有越于以前一?|站的机会?/p>
关键词六Q社?/p>
目前q些C|站Q在今天q个市场当中造星q动的能力,无论是芙蓉姐姐还是天仙妹妹,如何q用C的力量传播品牌,已经成ؓ不可忽视的一U主力量,而且是民意性的Q代表公正的民意性的力量所出现的,q种影响力是独特的,而不仅仅是以公关形式出现?/p>
关键词七Q定?/p>
有时候开玩笑Q搜索引擎,搜烦江南春,有时候搜索出来是江南春这个hQ有时候是一个年dU是江南春,是不是这个搜索引擎不理解我的需求呢Q我 惛_多搜索在不断走向化,不断了解搜烦者本w的需求,Ҏ长期搜烦的结果来判断你要搜烦的究竟是分众传媒的江南春Q还是年L南春。当它对你的搜烦?冉|q一步了解的时候,对你的兴判断和爱好的判断在不断加强的时候,它Ş成的数据库最l将能够每天先帮你在整个|络搜烦一遍,把你惌的内Ҏ到桌面, q样形成你个人桌面的主页Q这U趋势也是非常强有力的发展方向?/p>
关键词八Q收费化
q是巨大的市场。向消费者直接收费的模式我觉得会成ؓ未来的主导模式,世界杯收?0亿的q告已经是很大的数字了,如果看世界杯普通场一个h?2块钱Q决赛一个h?0块钱Q多h׃看了呢?跟电话̎单一P到月底结账,一个月你花30块钱看世界杯Q我觉得收入会非常恐怖。我们非常清晰地看到 未来内容收费的前途远q超q广告市场的前途,我觉得中国的IPTV、PayTV市场的潜力,对分众这L公司它不太能q入到内容市场,但也不是坏事Q中?端用户只能看PayTVQ对于PayTV的想象空_我想比今天中国的q告大得多得多?/p>
关键词九Q超媒体l构
当中国的七八千家个h|站形成一个联盟的形式的时候,当网站被一U特定的技术管理v来,量被统一化以后,如果你可以将软g攑֜背后去识别的?候,你可以挑挑跟你相关的q告的时候,q对q告L说也Ş成了价|你在哪个|站上不重要Q它越了媒体结构,可能在七八千个网站当中随旉C走进 来,我只要识别你的号码,l你挑挑q告Q广告主只想打动目标受众Q这U一对一的Ş式是未来的趋ѝ同时还可以按最后的点击或是最后生的消费行动来进行收 费,按照l果收费Q我惌L模式是无法抵挡的?/p>
cursor: crosshair;
cursor: pointer;
cursor: hand;
cursor: wait;
cursor: help;
cursor: no-drop;
cursor: text;
cursor: move;
cursor: n-resize;
cursor: s-resize;
cursor: e-resize;
cursor: w-resize;
cursor: ne-resize;
cursor: nw-resize;
cursor: se-resize;
cursor: sw-resize;
cursor: auto;
cursor:not-allowed;
cursor: progress;
cursor: default;
cursor: url(' # ');