大数据_我爱故事小小网

[bigdata-018] java spring 快捷入门

所属栏目：[大数据] 日期：2020-12-30 热度：86

1. spring学习，最好的材料是官网 http://sping.io/docs 2.安装jdk 3. 安装tomcat http://blog.csdn.net/zhuying_linux/article/details/6583096/ tomcat 8.5对应的jdk 1.7 把tomcat压缩包放到~/usr/tomcat里在/etc/profile加上CATALINA_HOME=/home/brian[详细]
bzoj 3100 K大数查询树套树

所属栏目：[大数据] 日期：2020-12-30 热度：74

外层权值线段树，对于每个权值线段树节点，建立区间线段树。但是内层这样普通建树会TLEMLE。仔细想会发现，区间线段树不用都建出来，用到哪个点就开哪一个点，每次操作最多经过logn个权值线段树节点，访问每个权值线段树节点时，最多修改logn个区间线段树[详细]
[bigdata-019] 禅道在linux上的安装

所属栏目：[大数据] 日期：2020-12-30 热度：62

1. 在ubuntu 14.04上安装部署禅道 ?? 2. 禅道有多种安装方式。有一键安装包。但如果你已经有了一个mysql数据库，就不能使用一键安装了。本文主要说明在已有mysql数据库下的安装。 3. 官方参考 http://www.zentao.net/book/zentaopmshelp/239.html 4. 下载[详细]
从0到1构建数据生态系列之六：数据价值挖掘

所属栏目：[大数据] 日期：2020-12-30 热度：165

副标题#e# 文·blogchong 这估计《从0到1构建数据生态系列》的最后一篇，主题是数据价值。在之前，我们所有做的一切一切，都是基础，那么其最终的目的是什么？当然，结果很明显，就是数据价值，那么，作为数据生态的最上层，所谓的数据价值又是以什么形式[详细]
这5种必知的大数据处理框架技术，你的项目到底应该使用其中的哪

所属栏目：[大数据] 日期：2020-12-30 热度：178

大数据是收集、整理、处理大容量数据集，并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限，但这种计算类型的普遍性、规模，以及价值在最近几年才经历了大规模扩展。本文将介绍大数据系统一个[详细]
[bigdata-020]用python3+pymogo 操作 mongodb数据库

所属栏目：[大数据] 日期：2020-12-30 热度：68

1. 安装pymongo pip install pymongo 2. 写一个例子 #!/usr/bin/env python3#! coding:utf-8 -*-import pymongoimport timeclient = pymongo.MongoClient('localhost',27017)db = client.get_database('user-behavior-data')print(db.name)backend = db.ge[详细]
bzoj 3110 K大数查询整体二分

所属栏目：[大数据] 日期：2020-12-30 热度：171

#includecstdio#includeiostream#define maxn 50005#define LL long longusing namespace std;int n,m;struct Que{ int op,l,r,x,id; void read() { scanf("%d%d%d%d",op,l,r,x); if(op==1) x+=n+1; }}q[50005];Que q1[maxn],q2[maxn];int ans[maxn];struc[详细]
电商数据分析：用七句话学会用数据监控类目销售

所属栏目：[大数据] 日期：2020-12-30 热度：144

副标题#e# 要想全盘掌握商品的销售情况，用数据监控类目是最科学的，标准化且可复制。具体怎么做？本文作者总结了七句话：销售是目标、毛利是根本、商品为核心、供应牢把控、行为是金矿、新品是未来、订单是纽带。理解这七句话，并付诸实践，将每句话都拆[详细]
视音频数据处理入门：UDP-RTP协议解析

所属栏目：[大数据] 日期：2020-12-27 热度：55

http://blog.csdn.net/leixiaohua1020/article/details/50535230[详细]
数据挖掘中的模式发现（八）轨迹模式挖掘、空间模式挖掘

所属栏目：[大数据] 日期：2020-12-27 热度：130

副标题#e# 这是模式挖掘、数据挖掘的一部分应用。空间模式挖掘(Mining Spatiotemporal Patterns) 两个空间实体之间存在若干拓扑关系，这些关系基于两个实体的位置：分离相交包含如图所示地表示位置信息，可以提取类似下面的规则： is_a(x,large_town)?[详细]
大数据领域常用技术栈

所属栏目：[大数据] 日期：2020-12-26 热度：88

副标题#e# 提起大数据，不得不提由IBM提出的关于大数据的5V特点：Volume（大量）、Velocity（高速）、Variety（多样）、Value（低价值密度）、Veracity（真实性），而对于大数据领域的从业人员的日常工作也与这5V密切相关。大数据技术在过去的几十年中取得[详细]
Databricks说的Lakehouse是什么？

所属栏目：[大数据] 日期：2020-12-26 热度：124

副标题#e# ? 在过去的几年里，Lakehouse作为一种新的数据管理范式，已独立出现在Databricks的许多用户和应用案例中。在这篇文章中，我们将阐述这种新范式以及它相对于之前方案的优势。数据仓库在决策支持和商业智能应用方面有着悠久的历史。自20世纪80年代[详细]
A-B Problem 大数相等

所属栏目：[大数据] 日期：2020-12-26 热度：73

A-B Problem http://acm.nyist.net/JudgeOnline/problem.php?pid=524 时间限制：1000?ms ?|? 内存限制：65535?KB 难度：3 输入有多组测试数据。每组数据包括两行，分别代表A和B。它们的位数小于100，且每个数字前中可能包含+,- 号。每个数字前面和后面[详细]
大数据时代必不可少的大数据分析和制作工具大全

所属栏目：[大数据] 日期：2020-12-26 热度：54

1.微信大数据分析工具新媒体指数：http://www.gsdata.cn 2.数据可视化工具百度ECharts：http://echarts.baidu.com/ Cytoscape：http://www.cytoscape.org/ 图表秀：http://www.tubiaoxiu.com/ 数据观：http://shujuguan.cn/ 微博足迹可视化：http://vis.[详细]
A+B Problem II 大数加法

所属栏目：[大数据] 日期：2020-12-26 热度：167

A+B Problem II http://acm.nyist.net/JudgeOnline/problem.php?pid=103 时间限制：3000?ms ?|? 内存限制：65535?KB 难度：3 输入 The first line of the input contains an integer T(1=T=20) which means the number of test cases. Then T lines follow[详细]
NBA篮球运动员大数据分析决策支持系统

所属栏目：[大数据] 日期：2020-12-26 热度：153

package com.dt.spark.sparksql import org.apache.hadoop.conf.Configuration import org.apache.hadoop.fs.{FileSystem,Path} import org.apache.spark.SparkConf import org.apache.spark.sql.SparkSession /** ? * NBA篮球运动员大数据分析决策支持系[详细]
条条大道通罗马：大数据分析工具的十条学习路径

所属栏目：[大数据] 日期：2020-12-26 热度：139

来自：IT经理网（微信号：ctociocom）链接：www.ctocio.com/hotnews/22900.html （点击尾部阅读原文前往）虽然只有极少数人能够修炼成数据科学家这一21世纪最性感多金专业人士，但对于大多数非数据分析专业的IT人士来说，掌握对路的大数据工具同样意味着[详细]
某种序列-大数计算

所属栏目：[大数据] 日期：2020-12-26 热度：136

某种序列 http://acm.nyist.net/JudgeOnline/problem.php?pid=114 时间限制：3000?ms ?|? 内存限制：65535?KB 难度：4 输入输入包含多行数据? 每行数据包含3个整数A0,A1,A2 (0 = A0,A2 = 100000000)? 数据以EOF结束输出对于输入的每一行输出A99的值样[详细]
企业BI系统应用的切入点及五大策略

所属栏目：[大数据] 日期：2020-12-26 热度：180

从技术的角度来看，BI的技术正在走向成熟，处于一个发展的阶段，但它促使了BI的应用在成本方面开始逐步的降低，越来越多的企业在BI应用方面取得了成功。从实施的角度来出发，实施商业智能系统是一项复杂的系统工程，整个项目涉及企业管理，运作管理，信息[详细]
挖掘隐式启动Activity可能存在的坑

所属栏目：[大数据] 日期：2020-12-26 热度：129

今日科技快讯很早之前，谷歌母公司Alphabet的董事长施密特就曾经表示，在中国市场，谷歌需要寻找到一个商业伙伴来开展自身的一些业务。而近日有消息传出，谷歌和网易正在进行合作磋商，很可能是成立合资公司，在国内推出针对中国市场的Google Play应用商[详细]
pyhive 连接 Hive 时错误

所属栏目：[大数据] 日期：2020-12-26 热度：180

一、User: xx is not allowed to impersonate xxx' 解决办法：修改 core-site.xml 文件，加入下面的内容后重启 hadoop。 property namehadoop.proxyuser.xx.hosts/name value*/value/propertyproperty namehadoop.proxyuser.xx.groups/name value*/value/p[详细]
分布式基础通信协议：paxos、totem 和 gossip（转载）

所属栏目：[大数据] 日期：2020-12-26 热度：186

背景：在分布式中，最难解决的一个问题就是多个节点间数据同步问题。为了解决这样的问题，涌现出了各种奇思妙想。只有在解决了如何进行信息同步的基础之上才衍生出形形色色的应用。这里开始介绍几种分布式通信协议。简单即有效——totem协议: totem协议[详细]
Hive 导入 parquet 格式数据

所属栏目：[大数据] 日期：2020-12-26 热度：136

Hive 导入 parquet 数据步骤如下：查看 parquet 文件的格式构造建表语句倒入数据一、查看 parquet 内容和结构下载地址社区工具 GitHub 地址命令查看结构： java -jar parquet-tools-1.6.0rc3-SNAPSHOT.jar schema -d activity.201711171437.0.parq[详细]
Presto 常用配置及操作

所属栏目：[大数据] 日期：2020-12-26 热度：183

一、介绍 Presto是一个开源的分布式SQL查询引擎，适用于交互式分析查询，数据量支持GB到PB字节。 Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题。推荐阅读 Presto实现原理和美团的使用实践二、安装 2.[详细]
大数据的技术生态概述（转载）

所属栏目：[大数据] 日期：2020-12-26 热度：149

副标题#e# 如何用形象的比喻描述大数据的技术生态？Hadoop、Hive、Spark 之间是什么关系？大数据本身是个很宽泛的概念，Hadoop生态圈（或者泛生态圈）基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗[详细]

6551

209