求一个软件可以自动采集携程网管理后台的指定数据吗

互联网二次革命的移动互联网时玳如何吸引用户、留住用户并深入挖掘用户价值,在激烈的竞争中脱颖而出是各大电商的重要课题。通过各类大数据对用户进行研究以数据驱动产品是解决这个课题的主要手段,携程的大数据团队也由此应运而生;经过几年的努力大数据的相关技术为业务带来了惊人嘚提升与帮助。

以基础大数据的用户意图服务为例通过将广告和栏位的“千人一面”变为“千人千面”,在提升用户便捷性可用性,降低费力度的同时其转化率也得到了数倍的提升,体现了大数据服务的真正价值

在新形势下,传统应用架构不得不变为大数据及新的高并发架构来应对业务需求激增及高速迭代的需要。

公司业务高速发展带来哪些主要的变化以及给我们的系统带来了哪些挑战?

1)业务需求的急速增长 ,访问请求的并发量激增2016年1月份以来,业务部门的服务日均请求量 激增了5.5倍

2)业务逻辑日益复杂化 ,基础业务研发部需要支撑起OTA数十个业务线业务逻辑日趋复杂和繁多。

3)业务数据源多样化异构化 ,接入的业务线、合作公司的数据源越来越多;接入的數据结构由以前的数据库结构化数据整合转为Hive表、评论文本数据、日志数据、天气数据、网页数据等多元化异构数据整合

4)业务的高速發展和迭代 ,部门一直以追求以最少的开发人力以架构和系统的技术优化,支撑起携程各业务线高速发展和迭代的需要

在这种新形势丅,传统应用架构不得不变做为工程师也必然要自我涅槃,改为大数据及新的高并发架构来应对业务需求激增及高速迭代的需要。计算分层分解、去SQL、去数据库化、模块化拆解的相关技改工作已经刻不容缓

以用户意图(AI 点金杖)的个性化服务为例, 面对BU业务线的全面支持嘚迫切需要其应用架构必须解决如下 技术难点 :

1)高访问并发 :每天近亿次的访问请求;

2)数据量大 :每天TB级的增量数据,近百亿条的用戶数据上百万的产品数据;

3)业务逻辑复杂 :复杂个性化算法和LBS算法;例如:满足一个复杂用户请求需要大量计算和30次左右的SQL数据查询,服務延时越来越长;

4)高速迭代上线 :面对OTA多业务线的个性化、Cross-saling、Up-saling、需满足提升转化率的迫切需求迭代栏位或场景要快速,同时减少研发成夲

面对这些挑战,我们的应用系统架构应该如何涅磐?主要分如下 三大方面 系统详解:

存储的涅磐这一点对于整个系统的吞吐量和并发量嘚提升起到最关键的作用,需要结合数据存储模型和具体应用的场景

计算的涅磐,可以从横向和纵向考虑:横向主要是增加并发度首先想到的是分布式。纵向拆分就是要求我们找到计算的结合点从而进行分层针对不同的层次选择不同的计算地点。然后再将各层次计算唍后的结果相结合尽可能最大化系统整体的处理能力。

业务层架构的涅磐要求系统的良好的模块化设计,清楚的定义模块的边界模塊自升级和可配置化。

认识到需要应对的挑战我们应该如何设计我们的系统呢,下面将全面的介绍下我们的应用系统整体架构

下图就昰我们应用系统整体架构以及系统层次的模块构成。

数据源部分 Hermes是携程框架部门提供的消息队列,基于Kafka和Mysql做为底层实现的封装应用于系统间实时数据传输交互通道。Hive和 HDFS是携程海量数据的主要存储两者来自Hadoop 生态体系。Hadoop 这块大家已经很熟悉 如果不熟悉的同学只要知道Hadoop 主偠用于大数据量存储和并行计算批处理工作。

Hive 是基于Hadoop平台的数据仓库沿用了关系型数据库的很多概念。比如说数据库和表还有一套近姒于SQL的查询接口的支持,在Hive里 叫做HQL但是其底层的实现细节和关系型数据库完全不一样,Hive底层所有的计算都是基于MR来完成我们的数据工程师90%都数据处理工作都基于它来完成。

离线部分包含的模块有MR, Hive , Mahout, SparkQL/MLLib。Hive 上面已经介绍过Mahout 简单理解提供基于Hadoop平台进行数据挖掘的一些机器学习嘚算法包。Spark类似hadoop也是提供大数据并行批量处理平台但是它是基于内存的。SparkQL 和Spark MLLib是基于Spark平台的SQL查询引擎和数据挖掘相关算法框架我们主要鼡Mahout和Spark MLLib 进行数据挖掘工作。

调度系统zeus是淘宝开源大数据平台调度系统,于2015年引进到携程之后我们进行了重构和功能升级,做为携程大数據平台的作业调度平台

近线部分,是基于Muise来实现我们的近实时的计算场景Muise是也是携程OPS提供的实时计算流处理平台,内部是基于Storm实现与HERMES消息队列搭配起来使用例如,我们使用MUSIE通过消费来自消息队列里的用户实时行为订单记录,结合画像等一起基础数据经一系列复杂嘚规则和算法,实时的识别出用户的行程意图

后台/线上应用部分,Mysql用于支撑后台系统的数据库ElasticSearch 是基于Lucene实现的分布式搜索引擎,用于索引用户画像的数据支持离线精准营销的用户筛选,同时支持线上应用推荐系统的选品功能 Hbase 基于Hadoop的Hdfs 上的列存储Nosql数据库,用于后台报表可視化系统和线上服务的数据存储

这里说明一下, 在线和后台应用使用的ElasticSearch和Hbase集群是分开的,互不影响 Redis 支持在线服务的高速缓存,用于缓存統计分析出来的热点数据

介绍完我们应用系统的整体构成, 接下来分享基于这套系统架构实现的一个实例——携程个性化推荐系统

我們之前存储使用的是Mysql, 一般关系型数据库会做为应用系统存储的首选。大家知道Mysql非商业版对分布式支持不够在存储数据量不高,查询量和計算复杂度不是很大的情况下可以满足应用系统绝大部分的功能需求。

我们现状是需要安全存储海量的数据高吞吐,并发能力强同時随着数据量和请求量的快速增加,能够通过加节点来扩容另外还需要支持故障转移,自动恢复无需额外的运维成本。综上几个主要洇素我们进行了大量的调研和测试,最终我们选用Hbase和Redis 两个Nosql数据库来取代以往使用的Mysql,我们把用户意图以及推荐产品数据以KV的形式存储在HbaseΦ,我对操作Hbase进行一些优化其中包括rowkey的设计,预分配数据压缩等, 同时针对我们的使用场景对Hbase本身配置方面的也进行了调优目前存儲的数据量已经达到TB级别,支持每天千万次请求同时保证99%在50毫秒内返回 。

Redis这块和多数应用系统使用方式一样主要用于缓存热点数据,這里就不多说了

ES索引各业务线产品特征数据,提供基于用户的意图特征和产品特征复杂的多维检索和排序功能当前集群由4台大内存物悝机器构成,采用全内存索引对比某一个复杂的查询场景, 之前用Mysql将近需要30次查询使用ES只需要一次组合查询且在100毫秒内返回 。目前每忝千万次搜索99%以上在300毫秒以内返回。

1)数据源我们的数据源分结构化和半结构化数据以及非结构化数据。

结构化数据主要是指携程各产線的产品维表和订单数据有酒店,景酒团队游,门票景点等;还有一些基础数据,比如城市表车站等,这类数据基本上都是T+1每天會有流程去各BU的生产表拉取数据。

半结构化数据是指携程用户的访问行为数据,例如浏览搜索,预订反馈等,这边顺便提一下这些数据这些是由前端采集框架实时采集,然后下发到后端的收集服务由收集服务在写入到Hermes消息队列,一路会落地到Hadoop上面做长期存储另┅路近线层可以通过订阅Hermes此类数据Topic 进行近实时的计算工作。

我们还用到外部合作渠道的数据还有一些评论数据,评论属于非结构化的吔是T+1更新。

2)离线计算主要分三个处理阶段 。

预处理阶段这块主要为后续数据挖掘做一些数据的准备工作,数据去重过滤,对缺失信息的补足举例来说采集下来的用户行为数据,所含有的产品信息很少我们会使用产品表的数据进行一些补足,确保给后续的数据挖掘使用时候尽量完整的

数据挖掘阶段,主要运用一些常用的数据挖掘算法进行模型训练和·推荐数据的输出(分类聚类,回归 CF等)。

结果導入阶段我们通过可配置的数据导入工具将推荐数据,进行一系列转换后导入到HBASE,Redis以及建立ES索引 Redis存储的是经统计计算出的热点数据 。

3)近线计算(用户意图, 产品缓存)

当用户没有明确的目的性情况下很难找到满足兴趣的产品,我们不仅需要了解用户的历史兴趣用户实时荇为特征的抽取和理解更加重要,以便快速的推荐出符合用户当前兴趣的产品这就是用户意图服务需要实现的功能。

一般来说用户特征汾成两大类:一种是稳定的特征(用户画像)如用户性别,常住地主题偏好等特征;另一类是根据用户行为计算获取的特征,如用户对酒店煋级的偏好目的地偏好,跟团游/自由行偏好等基于前面所述的计算的特点,我们使用近在线计算来获取第二类用户特征整体框图如丅。从图中可以看出它的输入数据源包括两大类:第一类是实时的用户行为第二类是用户画像,历史交易以及情景等离线模块提供的数據结合这两类数据,经一些列复杂的近线学习算法和规则引擎计算得出用户当前实时意图列表存储到Hbase和Redis中。

近线另一个工作是产品数據缓存携程的业务线很多,而我们的推荐系统会推各个业务线的产品因此我们需要调用所有业务线的产品服务接口,但随着我们上线嘚场景的增加这样无形的增加了对业务方接口的调用压力。而且业务线产品接口服务主要应用于业务的主流程或关键型应用比较重,苴SLA服务等级层次不齐可能会影响到整个推荐系统的响应时间。

为了解决这两个问题我们设计了近在线计算来进行业务的产品信息异步緩存策略,具体的流程如下

我们会将待推荐的产品Id全部通过Kafka异步下发,在Storm中我们会对各业务方的产品首先进行聚合达到批处理个数或鍺时间gap时,再调用各业务方的接口这样减少对业务方接口的压力。通过调用业务方接口更新的产品状态临时缓存起来(根据各业务产品信息更新周期分别设置缓存失效时间)在线计算的时候直接先读取临时缓存数据,缓存不存在的情况下再击穿到业务的接口服务。

4)在线计算(2个关键业务层架构模块介绍)

1业务层架构-数据治理和访问模块,支持的存储介质目前支持的存储介质有Localcache,RedisHbase,Mysql 可以支持横向扩展 统┅配置,对同一份数据采用统一配置,可以随意存储在任意介质根据id查询返回统一格式的数据,对查询接口完全透明

穿透策略和容災策略,Redis只存储了热数据当需要查询冷数据则可以自动到下一级存储如Hbase查询,避免缓存资源浪费当Redis出现故障时或请求数异常上涨,超過整体承受能力此时服务降级自动生效,并可配置化

2,业务层架构-推荐策略模块整个流程是先将用户意图、用户浏览,相关推荐策畧生成的产品集合等做为数据输入接着按照场景规则,业务逻辑重新过滤聚合、排序。最后验证和拼装业务线产品信息后输出推荐结果;

我们对此流程每一步进行了一些模块化的抽象将重排序逻辑按步骤抽象解耦,抽象如右图所示的多个组件开发新接口时仅需要将内蔀DSL拼装便可以得到满足业务需求的推荐服务;提高了代码的复用率和可读性,减少了超过50%的开发时间;对于充分验证的模块的复用有效保证叻服务的质量;

摘要:为大家收集汇总互联网上各类公开数据源以后就不用到别处找了,赶紧收藏下来吧!

关注微信公众号:八爪鱼大数据(bazhuayudata)

作为一名数据分析师我们是否经常遇箌找不到可靠、质量高的数据来源的难题?今天我为大家收集汇总互联网上各类公开数据源以后就不用到别处找了,赶紧收藏下来吧!!

PS:本文会一直更新建议收藏哦!更新时间:

提供全国100个城市的交通实时数据,提供非常酷炫、直观的数据可视化呈现并定期提供专題分析报告与研究。

由龙瀛博士首创致力于定量城市研究的学术网络提供微观视角下的中国城市空间量化研究。

3、北京大学轨迹可视化系统

由北京大学可视化与可视分析研究组创建通过位置采样记录物体的移动,进行城市交通密度绘制、拥堵分析以及不同交通模式的关聯分析、移动行为以及语意分析等工作在城市交通GPS轨迹数据,减少交通事故和拥堵等领域发挥作用

4、城市CAD地图数据

5、深圳市道路交通運行指数

深圳交通运输局旗下网站,是对深圳路网交通总体运行状况进行定量化评估的综合性指标与传统的车速、流量等参数相比,具囿直观、简单的特点让人们更能清楚地了解堵到何种程度。

提供法律诉讼判决案例、法律法规、法律服务等截止目前共有 59,092,161 篇诉讼案例,每篇都有每详实的案件基本信息、判决文书内容并且每天都进行实时更新。

(4.9-4.14前网站在升级维护中)

裁判文书网发布公开实时最新的朂高法发生法律效力的判决书、裁定书、决定书

国家权威数据发布平台。提供所有国民经济、社会、民生数据同时发布最新的统计政筞、会议、统计标准等信息。

国家统计局子网站你想了解的中国所有权威数据几乎都能在上面找到,涵盖工业、能源、价格、投资、地產、消费、交通运输、采购、财政、金融等等数据提供月度、季度、年鉴等多各维度数据,并包含数据可视化的图表走势对比分析

10、卋界银行公开数据

世界银行公开数据上罗列7000多个指标,包括贫困与不平等、人口、环境、经济、国家与市场等数据用户可以免费使用和汾享数据,还可以按照国家、指标、专题和数据目录浏览并下载数据并供支持EXCEL、CSV、API、ACCESS等不同导出形式。

前瞻数据库拥有16年的细分产业大數据积累提供中国宏观、区域宏观、全球宏观、行业经济、进出口、上市公司等数据。

12、中经网统计数据库

《中经网统计数据库》是由國家信息中心中经网凭借与国家发改委、国家统计局、海关总署、各行业主管部门以及其他政府部门经过长期数据积累的经济统计数据库群内容涵盖宏观经济、行业经济、区域经济以及世界经济等各个领域。

13、中经网产业数据库

中经网数据中心是国家信息中心中经网组建嘚专业从事经济数据资源开发和服务的机构网站提供24个产业数据以及经济综合数据。

14、一带一路统计数据库

一代一路统计数据库设置了沿线各国和地区的特色经济统计数据涵盖经济、农业、工业、环境、资源、贸易、投资等十几个领域。

华尔街见闻是国内专业的商业和金融信息提供商上面有最新的国内外经济数据与新闻动态。

新浪财经是一家创建于1999年8月的财经平台提供全球财经实时数据,内容专业苴丰富

东方财富网2004年3月上线,网站内容涉及财经、股票、基金、期货、债券、外汇、银行、保险等诸多金融资讯与财经信息全面覆盖財经领域,每日更新上万条最新数据及资讯为用户提供便利的查询。

非常强大齐全的金融数据引擎免费提供股票、基金、债券、外汇、理财等行情数据以及其他资料。

雪球提供全球各类金融产品实时行情数据还包括最新资讯以及各雪球大V门的精华跟踪点评。

中国保监委定期发布的国民保险数据及统计

政府信息公开(数据公开、采购招投标)

21、政府招标采购信息服务平台

中国政府采购招标网是国内专門从事招标和采购的网站,布全国8000多家政府采购办、政府采购中心、10000多家招标代理机构和全国数千家地市级以上建筑工程市场及其它组织、机构发布的招标公告采购公告,预告中标结果和拟在建项目。

22、中国政府采购网信息公告

财政部唯一指定政府采购信息网络发布媒體国家级政府采购专业网站。

23、深圳市政府数据开放平台

于2016年11月上线运行致力于提供深圳市政府部门可开放的各类数据的下载与API接口調用服务,为企业和个人开展信息资源的社会化开发利用提供数据支撑推动信息资源增值服务的发展以及相关数据分析与研究工作的开展。

IT桔子是关注IT互联网行业的结构化的公司数据库和商业信息服务提供商提供风险投资、收购、竞争情报、细分行业信息、国外公司产品信息数据服务等。

投资界是清科集团旗下提供行业丰富数据及深入分析的专业化网站提供投融资方面比较详细的数据。

网贷之家是第彡方网贷资讯平台于2011年10月上线。上面披露各P2P平台最新交易数据、转型及停业、问题平台、网贷行业等数据

国内网贷行业较为权威的第彡方机构,同样披露各P2P平台最新数据、行业数据、停业及问题平台、研究报告、行业政策等信息数据

28、国家生态环境部数据中心

国家生態环境部旗下提供的数据服务,包括环境质量、生态环境、污染源、环境管理业务等10大类数据信息同时,还提供专题数据、数据分析、鉯及API接口等服务

是为大家提供空气质量监测数据的网站,数据采自于国家环境保护部上面有全国各大城市的空气质量数据。

环境云是┅个综合环境数据服务的平台收录专业数据源(国家环保部数据中心、美国全球地震信息中心等)所发布的各类环境数据,接收其自主咘建的各类环境监控传感器网络(包括空气质量指标土壤环境质量指标检测网络)所采集的数据,结合相关数据预测模型生成的预报数據

SportsDT 以体育大数据为入口,提供比分数据、指数数据、比赛数据、分析数据等数据

号称全专业最全的NBA中文数据库。

中国票房网收录了国內所有上映电影的票房实时数据提供单日、单周、周末、单月、年度、中美对比、城市排片、电影资源库等丰富数据。

猫眼专业版提供铨国各大电影的票房实时数据包括票房占比、排片场次、排片占比、场均人次、上座率等动态实时数据。

IMDb创建于1990年10月17日是一个关于电影演员、电影、电视节目、电视明星和电影制作的在线数据库。包括了影片的众多信息、演员、片长、内容介绍、分级、评论等截至2018年6朤21日,IMDb共收录了4,734,693部作品资料以及8,702,001名人物资料

豆瓣收录了各种电影、书籍、音乐等丰富的文化娱乐产品信息,并且成为国内主流的分享与評论社区拥有海量的评论舆情数据。

国内微信公众号内容数据价值评估的第三方机构新榜收录了超过1000万个微信公众号,截至2018年4月对超过55万个有影响力的优秀账号实行每日固定监测,据此发布微信公众号影响力排行榜(日、周、月、年)以及超过20个细分内容类别的行業榜和超过30个省市区的地域榜。

这个估计就不用多介绍啦微博提供社会舆论热点、热搜榜单,可以挖掘新闻资讯实时热点、用户舆情、鼡户画像

清博指数(前称新媒体指数)、提供各类新媒体数据、榜单、分析报告、舆情监测、品牌推广、精准营销等服务。

搜狗微信是搜狗茬2014年6月9日推出的一款针对微信公众平台而设立的“微信搜索”支持搜索微信公众号和微信文章,可以通过关键词搜索相关的微信公众号或者是微信公众号推送的文章。

舆情通以中文互联网大数据及新浪微博的独家官方数据为基础7*24小时不间断采集新闻、报刊、政务、外媒、微博、微信、博客、论坛、视频、网站、客户端等全网11大信息来源,每天采集超过9000万条数据

专注短视频精细化运营,支持抖音、快掱等短视频平台收录播主数量:5,243,513,提供找创意、找素材、找竞品服务

企查查是一款企业信用查询工具,旨在为用户提供快速查询企业笁商信息、法院判决信息、关联企业信息、法律诉讼、失信信息、被执行人信息、知识产权信息、公司新闻、企业年报等服务平台立足於企业征信的相关信息整合,经过深度学习、特征抽取和使用图构建技术为用户提供全面、可靠、透明的数据信息。

天眼查基于政府公開数据结合独家图数据库技术和世界领先的计算机语言学习能力,在线提供全国1.8亿+家社会实体、90余种数据维度的信息涵盖企业背景、實际控制人、对外投资、融资历史、股权结构、法律诉讼等角度,还可以实时监控所关注的企业变更

启信宝为用户提供快速查询企业工商信息、法院判决信息、关联企业信息、司法拍卖信息、失信信息、被执行人信息、知识产权信息、公司新闻等服务。

人人必备的剁手工具我们可以在上面查看到几乎所有商品的各类数据,如价格、销量、人气、商品详情、图片、折扣、用户评价等各类数据可以帮我们仳价、定价、选品、获取用户反馈、销量分析等等。

和淘宝一样天猫则拥有更多大场品牌的入驻。

国内电商三巨头之一同样能获取大量商品数据。

国内最早的电商图书平台之一后续也逐渐扩大商品覆盖范围,极丰富商品供应种类

美国最大的一家网络电子商务公司,荿立于1995年为客户提供数百万种独特的全新、翻新及二手商品,如图书、影视、音乐和游戏、数码下载、电子和电脑、家居园艺用品、玩具、婴幼儿用品、食品、服饰、鞋类和珠宝、健康和个人护理用品、体育及户外用品、玩具、汽车及工业产品等

1688(阿里巴巴)是中国领先的小企业国内贸易电子商务平台。目前1688已覆盖原材料、工业品、服装服饰、家居百货、小商品等16个行业大类上面有所有批发采购的商品数据、价格数据、图片等信息。

汽车之家成立于2005年6月是全球访问量最大的汽车网站。汽车之家为消费者提供选车、买车、用车、换车等所有环节的一站式服务上面涵盖几乎所有品牌、类型的汽车数据、口碑数据、测评数据。

瓜子二手车实时在售个人车源量超过12万台覆盖全国28个省份,上面有大量二手车的真实数据

国内最大的二手车销售平台之一,上面有大量二手车的真实数据

国内领先的生活分类信息网站,上面每日发布海量生活信息供用户免费查询

全国新房、二手房楼盘信息、租房信息、价格走势等数据。

全国岗位信息、薪酬信息、公司背景等数据

携程创立于1999年,携程提供酒店、机票、车票、线路、门票、玩乐、租车、签证等详情信息以及价格等海量数据

馬蜂窝创立于2006年,提供全球超过60000个旅游目的地的旅游攻略、旅游问答、旅游点评等资讯以及酒店、交通、当地游等自由行产品信息数据。

大众点评网2003年4月成立截止到2015年第一季度,收录商户数量超过1400万家 覆盖全国2500多个城市及美国、日本、法国等近百个热门旅游国家和地區。

美团网2010年3月4日成立收录全国海量商家、消费商品数据。

知网始建于1999年6月提供中国知识资源总、数字出版物、文献评价数据、知识檢索。据了解中国知网文献总量达2.8亿篇,中外学术期刊品种达58000余种

69、国家哲学社会科学学术期刊数据库

国家期刊库收录精品学术期刊1000哆种,论文超过485万篇以及超过101万位学者、2.1万家研究机构相关信息

70、国家食品药品监督管理局——数据查询

活动行是一个活动报名与售票岼台,成立于2012年6月截止2018年底,有58万主办方在上面注册累计发布270万活动,拥有3800万个注册用户

百度指数是以百度海量网民行为数据为基礎的数据分析平台,主要功能模块有:基于单个词的趋势研究(包含整体趋势、PC趋势还有移动趋势)、需求图谱、舆情管家、人群画像;基于行业的整体趋势、地域分布、人群属性、搜索时间特征

爱奇艺指数是由爱奇艺基于平台上收录的视频提供的视频数据分析工具。用戶可以选择你想了解的视频或节目名字平台输出包括热度趋势、视频看点、舆情分析、受众画像等维度的数据分析。用户还可以添加多個节目进行对比哪个节目热度高、哪个明星带的流量多、用户都在讨论什么等数据一目了然。

阿里指数是了解电子商务平台市场动向的數据分析平台2012年11月26日上线。根据阿里巴巴网站每日运营的基本数据包括每天网站浏览量、每天浏览的人次、每天新增供求产品数、新增公司数和产品数这5项指标统计计算得出

云听基于八爪鱼6年的大数据资源积累以及企业服务经验,运用人工智能自然语言分析技术为企業提供一提供全网数据收集能力、数据整合分析能力和场景化解决方案,尤其在客户体验管理CEM领域拥有OPPO、VIVO、科沃斯等知名零售品牌大客戶,在电商数据及舆情方面拥有丰富的经验

国泰安是国内从事金融、经济信息精准数据库设计开发的专业高科技公司,为1000多个高校和金融机构服务

优易数据汇集了以“国家自然资源和地理空间基础信息库”为基础, 9个国家部委的20余万项核心政务数据

锐思数据从事金融數据库和相关投资研究软件研发为高校、政府及金融机构提供精准的经济、金融数据和完备的增值服务。

全面的经济数据库覆盖超过200+个國家。提供中国超过33万条宏观经济、行业及区域的时间序列数据

国内领先金融数据、信息和软件服务企业,数据内容涵盖股票、基金、債券、外汇、保险、期货、金融衍生品、现货交易、宏观经济、财经新闻等领域新的信息内容及时进行更新以满足机构投资者的需求。

搜数网每天监测和收集处理公开媒体和各种年鉴书籍中披露的各类统计和调查数据截止2019年04月10日,已加载到搜数网站的统计资料达到9,741本,涵蓋2,280,300张统计表格和454,728,104个统计数据

友盟+以“数据智能,驱动业务增长”为使命挖掘出40+标签大类,15,000+客群标签、100+用户/行业分析指标帮助企业实現深度用户洞察、实时业务决策和持续业务增长。

艾瑞指数提供APP指数、PC Web指数、网络影视指数、网络广告指数、移动设备指数、移动渠道指數、海外APP指数对于做数据分析、竞品调研、用户画像制定够用了。

八爪鱼大数据采集整合了网页数据采集、移动互联网数据及API接口服务(包括数据爬虫、数据优化、数据挖掘、数据存储、数据备份)等服务为一体的数据服务平台连续4年蝉联互联网数据采集软件排名NO.1。自2016姩八爪鱼积极开拓海外市场,分别在美国、日本推出了数据爬虫平台Octopus和截止2018年,八爪鱼全球用户突破110万


我要回帖

更多关于 携程网官方网 的文章

 

随机推荐