社交网络之美

Views:
 
     
 

Presentation Description

No description available.

Comments

By: kotime42 (22 month(s) ago)

I'm the author of this PPT, you are not authorized to public this PPT, please delete, thank you. Darren Fu

Presentation Transcript

Slide 1: 

傅冬雷 fudongl@cn.ibm.com Lotus, CDL, IBM 社交网络之美——可视化实现 中国软件开发实验室 (CDL) - Lotus

大纲 : 

2 大纲 可视化简介 社交网络简介 可视化在社交网络中的应用与实践 企业社交网络及可视化的应用与实践

可视化简介 : 

3 可视化简介 可视化概念及领域划分 可视化技术的特点 Web 适用范围 具体技术与方法

可视化概念及领域划分 : 

4 可视化概念及领域划分 定义 可视化是指用于创建图形、图像或动画,以便交流沟通讯息的任何技术和方法 领域划分 科学可视化 信息可视化 知识可视化 地理可视化 …… 数据可视化

可视化概念及领域划分(续) : 

科学可视化: 运用计算机图形学和图像处理技术,将数据换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术 信息可视化: 致力于创建那些以直观方式传达抽象信息的手段和方法,使得用户能够目睹、探索以至立即理解大量的信息 5 可视化概念及领域划分(续) 学术界 科学可视化(狭义)源于科学计算数据的可视化,衍生出工程数据、测量数据的可视化可视化对象:某些数学模型的结果或者是大型数据集 信息可视化(广义)源自信息图形、统计学、人工智能、用户界面等领域可视化对象:具有自身内在固有结构的抽象数据 工业界

可视化技术的特点 : 

6 可视化技术的特点 交互性:用户体验感强 多维性:可按每一维的属性与值,对数据进行分类、排序、过滤、组合和显示 可视性:直观! 通过图象、曲线、二维图形、三维体和动画来显示数据,并对其模式和相互关系进行分析(在社交网络领域中称为 SNA,即社交网络分析)

Web 适用范围 : 

思维导图 新闻的显示 数据的显示 (信息: 人、知识) 连接的显示 (相互关系) 网站的显示 7 Web 适用范围 Music and movie visualization tool Any Last.fm user’s social network

具体技术与方法 : 

8 具体技术与方法 Web 技术 的贡献

社交网络简介 : 

9 社交网络简介 定义 社交网络中的关键字 我们身边的社交网络 社交网站的应用程序接口

定义 : 

10 定义 六度分隔理论: 美国著名社会心理学家 Stanley Milgram 于20世纪60年代最先提出,在人际脉络中,要结识任何一位陌生的朋友,这中间最多只要通过六个朋友就能达到目的。

社交网络起源和研究历史 : 

社交网络起源和研究历史 如今的SNA已经成为了一个包扩 自有理论表述、方法、分析软件 和研究群体的完整领域 人类就已经用社交网络来标识各种层次上的社会系统中 成员关系的复杂集合 3条独立开展的研究分支: 美国30年代:源于格式塔心理学。社会关系网图被发明 美国30年代:哈佛研究小组研究组中的小圈子现象 英国50年代:英格兰人类学研究小组,引入了图论 Harrison领导的哈佛研究团队着力于研究 社交结构中的数学理论基础,建立了SNA中的基本概念。著名的“六度分隔”理论也在这时期提出 基于互联网的沟通极大促进了SNA的普及

“小世界”实验和 “六度分隔”假说 : 

“小世界”实验和 “六度分隔”假说 Stanley Milgram最早提出“六度分隔”假说,认为任意两个美国人能通过平均6个人的接力联系到 哥伦比亚大学的“小世界”实验证明通过email的方式任意两个人的联系可以通过5到7个人达成 假说目前还未被证明,却已经有了许多卓有成效的应用

Dunbar 理论 (150规则) : 

Dunbar 理论 (150规则) 研究结论:在一个社区中,一个人可以控制的用户数量最多为150人。 Robin Dunbar最近的研究显示:人的大脑最多可以保留150个有意义的朋友关系,不论你的朋友圈子有多少。 人能够记住和有感情交流的人数是有限的。而更大的网络,由经济利益驱使,会产生欺瞒和撒谎。 研究显示,女性更善于通过交流处理人们之间的关系;而男性则需要从事实际活动。比如,女性通过在线活动诸如玩游戏或是共享图像等对朋友产生不同的态度;而男性会建立更深的关系,如果他们参与程序项目或是在线游戏。

社交网络的基本概念 : 

社交网络的基本概念 节点 表示个体或组织 节点的属性不重要 边 可以抽象广泛的社会关系 血缘关系 社会角色 情感表达 资源交换 ...... SNA研究对象:网络结构 探索结构如何影响社会规则

Slide 15: 

15 网络分类 按参与者范围划分 完全网络 给定人群的网络 个人中心(Egocentric)网络 按网络属性划分 单极的、多极的或离散的 有界的、无界的 ……

Slide 16: 

16 SNA中节点的度量指标 – 位置!位置!!位置!!! Centrality 中心性 – 反映一个节点链接到整个网络的能力 Degree 度:链接到该点的所有边数 Betweenness 中间状态:衡量该点关联任意两个点的能力。越多关联其他点的最短路径经过该点,则值越高 Closeness 紧密性:衡量该点快速到达网络其他点的能力。可以定义为该点到网络其他所有点的最短路径之和的倒数 不同位置对应的网络角色 高Degree节点:Hub、Connector 连接不同网络簇的节点:Broker、Bridge、Boundary Spanner 网络边缘节点:Peripheral Player

SNA中边的度量指标-强连接和弱连接 : 

SNA中边的度量指标-强连接和弱连接 弱连接的含义 节点之间联系强度和频率较弱 常常是指向网络外部个体的松散链接 弱连接的价值 将新信息引入本网络 触发创新和新的机会 强连接的价值 保证信息被充分理解

SNA中网络整体结构的度量指标 : 

SNA中网络整体结构的度量指标 Centralization 中央集权性 一个高度中央集权的网络由少数中心节点支配,容易形成单点失效,使得网络很容易被分解 Density 密度 网络中实际边的数量与最大可能数量的比率 一个稠密的网络具有更多冗余的边,反映成员交流越密切,网络更健壮 Cohesion 内聚力 从任一点访问其他所有点走过的距离的平均值 值越低、内聚力越高,反映一个组传递和利用信息的能力越强

中央集权网络单点失效示例 : 

中央集权网络单点失效示例 该网络存在的问题: Sam:中心人物但也是瓶颈 Earl:连接外部网络关键人物但缺乏内部连接 Carl:孤立者,可能会离职 总体来说:各个小组间的信息交流过少

中央集权网络单点失效示例 : 

该网络存在的问题: Sam:中心人物但也是瓶颈 Earl:连接外部网络关键人物但缺乏内部连接 Carl:孤立者,可能会离职 总体来说:各个小组间的信息交流过少 中央集权网络单点失效示例

SNA中网络整体结构的度量指标 –网络密度 : 

SNA中网络整体结构的度量指标 –网络密度 稀疏网络 稠密网络

SNA的度量指标 –网络内聚力 : 

SNA的度量指标 –网络内聚力 高内聚力 低内聚力

主流社交网络分析和可视化工具 : 

主流社交网络分析和可视化工具 选择SNA工具的标准: 应用领域(科研还是商业分析) 用户具备的数学基础 处理大量数据的能力 面向商业应用: InFlow (www.orgnet.com) 面向科学研究: UCINET (http://www.analytictech.com/ucinet.htm)

Slide 24: 

我们身边的社交网络——国外的社交网站

我们身边的社交网络——国内的社交网站 : 

25 我们身边的社交网络——国内的社交网站

我们身边的社交网络——国内外社交网站/工具比较 : 

26 我们身边的社交网络——国内外社交网站/工具比较

社交网站的应用程序接口 : 

27 社交网站的应用程序接口 新模式:允许第三方开发人员或开发商,能够打造基于社交网站的全新业务,从而推广网站本身。这种规范,用技术的行话说,就是应用程序接口 (API)。 现状:国外知名网站(如Facebook, Twitter, Flickr, delicious等)已具备完善的API接口提供给第三方开发人员。而国内最近才有少数社交网站(如人人网、新浪微博等)提供了它们的 API。而IBM内的社交网站 90%都提供了API,便于服务集成。 运用好各大SNS站点提供的各类API接口,完全可以开发出功能强大、用户体验良好、多维的社交网络可视化分析应用!

可视化在社交网络中的应用与实践 ——数据 : 

28 可视化在社交网络中的应用与实践 ——数据 问1:如果你想开发一个类似的可视化应用,最希望社交网站提供哪几种API接口? 答:图片API(如人物头像)…… 问2:可视化的社交网络由哪些元素组成? 由一组人组成的 网络结构:节点 (Node)、边 (Relationship)、集群 (Cluster) 好友列表API,社区成员列表 API 由人和内容组成的混合网络结构:节点、 边、集群、以颜色/形状区分节点 人员发布/订阅内容(或活动)API 基于地图的网络结构:地图、坐标 地图API,人员地理位置 API

可视化在社交网络中的应用与实践 —— 集成 : 

29 可视化在社交网络中的应用与实践 —— 集成 Mashup - 混搭

可视化在社交网络中的应用与实践 —— 社交网络演变与超大规模网络 : 

30 可视化在社交网络中的应用与实践 —— 社交网络演变与超大规模网络

可视化在社交网络中的应用与实践 —— 流程 : 

31 可视化在社交网络中的应用与实践 —— 流程

企业内部的社交网络与可视化的应用与实践——IBM的社交产品软件 : 

32 企业内部的社交网络与可视化的应用与实践——IBM的社交产品软件

Slide 33: 

的基于社交软件设计的 企业社交网络分析及可视化平台IBM Atlas for Lotus Connections (Internal version: SmallBlue) 33

Atlas for Lotus Connections : 

Atlas for Lotus Connections Find 专家搜索引擎 企业级专家搜索引擎和社交网络分析工具箱 与IBM社交软件Lotus Connections相辅相承 Atlas,中文名“地图”,表示通过按图索翼能让你清楚企业中“谁知道什么”、“谁认识谁”、“谁了解谁的哪方面”这三个有价值的信息 Reach 社交路径指示工具 Net 企业社交网络可视化分析 MyNet 个人社交网络可视化分析 34

专家搜索解决方案 – Atlas Find & Reach : 

核心思想 – “信息聚合” 专家搜索解决方案 – Atlas Find & Reach 事半功倍 35

企业社交网络可视化分析 – Atlas Net 需求和功能 : 

企业社交网络可视化分析 – Atlas Net 需求和功能 轻量级企业社交网络分析工具 针对不同类型人群 匹配同类特征的人群 非正式圈子(社区、群组) 正式组织架构 注重可用性的可视化表达 可定制化的信息表达 快速识别关键人物 排序和过滤 缩放和拖拽 36

企业社交网络可视化分析 – Atlas Net 需求和功能(续) : 

企业社交网络可视化分析 – Atlas Net 需求和功能(续) 37

企业社交网络可视化分析 – Atlas Net 需求和功能(续) : 

企业社交网络可视化分析 – Atlas Net 需求和功能(续) 38

企业社交网络可视化分析 – Atlas MyNet 需求和功能 : 

企业社交网络可视化分析 – Atlas MyNet 需求和功能 个人社交网络分析工具 帮助用户评估个人社交状况 我的社交状况健康吗? 数量 多样性 艾蒙对于我的社交价值 他认识多少人 他认识哪些人 我的社交圈子发展趋势 数量变化 多样性 交往频率 39

表示社交网络结构图的数据格式 : 

表示社交网络结构图的数据格式 GraphML <?xml version="1.0" encoding="UTF-8"?> <graphml xmlns="http://graphml.graphdrawing.org/xmlns" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://graphml.graphdrawing.org/xmlns http://graphml.graphdrawing.org/xmlns/1.0/graphml.xsd"> <!--data schema--> <key id="emailID" for="node" attr.name="emailID" attr.type="string" /> <key id="name" for="node" attr.name="name" attr.type="string" /> <key id="strength" for="edge" attr.name="strength" attr.type="float" /> <key id="starttime" for="edge" attr.name="startTime" attr.type="string" /> <key id="endtime" for="edge" attr.name="endTime" attr.type="string" /> <graph id="AtlasNetXMLOutput" edgedefault="undirected"> <!--nodes--> <node id="0"> <data key="emailID">joe@ibm.com</data> <data key="name">Joe</data> </node> <node id="1"> <data key="emailID">chris@ibm.com</data> <data key="name">Chris</data> </node> <!--edges--> <edge source="0" target="1"> <data key="starttime">20081201T00:00:00Z</data> <data key="strength">0.6721147819477614</data> <data key="endtime">20081231T59:59:59Z</data> </edge> </graph> </graphml> 40

社交网络可视化分析应用的性能 : 

社交网络可视化分析应用的性能 服务器端和浏览器端负载分配 RIA:功能与性能,鱼与熊掌可兼得? 解决方案:混搭 – Java + Flash + JavaScript – C (Adobe Alchemy) + Flash + Javascript – HTML 5 ? 海量数据下的索引性能 多线程?还不够快 分布式计算,网格计算,云计算 41

Slide 42: 

42 社交网络可视化的未来 促进社交网络发展的新技术 位置觉察技术 大屏幕显示 复杂网络显示技术 社交网络演变 地理位置服务(Location Based Services)—— MoSoSo(Mobile social software)服务 促进社交网络发展的应用 SNA帮助分析社交模式如何助长或抑制流行病在人群中的传播 SNA帮助分析恐怖分子/犯罪嫌疑人的社交网络,以对抗恐怖主义,或有助于破案 社交网络在不同文化背景下的应用和实践

参考资料 : 

43 参考资料 网络资源 50 Great Examples of Internet Visualization: http://www.webdesignerdepot.com/2009/06/50-great-examples-of-data-visualization/ 数据可视化,维基百科 信息可视化,维基百科 使用 Flash 描述复杂的社交网络 ——力导向算法的两种实现与性能分析, developerWorks 25+ Useful Infographics for Web Designers, webdesignerdepot.com, 2009年6月 50 Great Examples of Data Visualization, webdesignerdepot.com, 2009年6月 INSNA: http://www.insna.org 教科书 入门:Social Network Analysis: A Handbook (John Scott) 进阶:Social Network Analysis: Methods and Applications (Stanley Wasserman, Kathleen Faust)

Q & A : 

Q & A 44

Slide 45: 

45