hive(四) -- 内(外)部表、分区和分桶表

内部表和外部表

默认情况下创建的表就是内部表,Hive拥有该表的结构和文件。换句话说,Hive完全管理表(元数据和数据)的生命周期,类似于RDBMS中的表。当你删除内部表时,它会删除数据以及表的元数据。可以使用DESCRIBE FORMATTED tablename,来获取表的元数据描述信息,从中可以看出表的类型。

image
外部表(External table )中的数据不是Hive拥有或管理的,只管理表元数据的生命周期。要创建一个外部表,需要使用EXTERNAL语法关键字。删除外部表只会删除元数据,而不会删除实际数据。在Hive外部仍然可以访问实际数据。实际场景中,外部表搭配location语法指定数据的路径,可以让数据更安全。

主要差异

  • 无论内部表还是外部表,Hive都在Hive Metastore中管理表定义、字段类型等元数据信息。
  • 删除内部表时,除了会从Metastore中删除表元数据,还会从HDFS中删除其所有数据文件。
  • 删除外部表时,只会从Metastore中删除表的元数据,并保持HDFS位置中的实际数据不变。
-- 创建内部表 加载数据
create table t_user_inner(
    id int,
    uname string,
    pwd string,
    sex string,
    age int
)row format delimited fields terminated by ',';
load data local inpath '/root/user.txt' into table t_user_inner;
-- 查看表信息
desc formatted t_user_inner ;
-- 创建外部表 加载数据
create external table t_user_ext(
         id int,
         uname string,
         pwd string,
         sex string,
         age int
)row format delimited fields terminated by ',';
load data local inpath '/root/user.txt' into table t_user_ext;
-- 查看表信息
desc formatted table t_user_ext;


-- 删除内部表  数据被删除了
drop  table t_user_inner;
-- 删除外部表  数据并没有被删除
drop  table t_user_ext;

-- 再次重新创建 t_user_ext 可以直接查询数据
select * from  t_user_ext;

-- 将t_user_ext 转换为内部表
alter table t_user_ext set tblproperties('EXTERNAL'='FALSE'); -- 要求KV的大小写
-- 查询表信息发现 Table Type: MANAGED_TABLE
desc formatted t_user_ext; 
--将t_user_ext 转换为外部表
alter table t_user_ext set tblproperties('EXTERNAL'='true');
-- 查询表信息发现 Table Type:EXTERNAL_TABLE
desc formatted t_user_ext;

分区表

分区表实际上就是将表中的数据以某种维度进行划分文件夹管理 ,当要查询数据的时候,根据维度直接加载对应文件夹下的数据! 不用加载整张表所有的数据再进行过滤, 从而提升处理数据的效率!

比如在一个学生表中想查询某一个年级的学生,如果不分区,需要在整个数据文件中全表扫描,但是分区后只需要查询对应分区的文件即可.

image

静态分区

所谓静态分区指的是分区的属性值是由用户在加载数据的时候手动指定的

1.创建单分区表:

-- 创建学生表 分区字段为年级grade
CREATE TABLE  t_student (
    sid int,
    sname string
 ) partitioned by(grade int)   -- 指定分区字段
row format delimited fields terminated by ',';
-- 注意∶分区字段不能是表中已经存在的字段,因为分区字段最终也会以虚拟字段的形式显示在表结构上。
select * from t_student;
+----------------+------------------+------------------+
| t_student.sid  | t_student.sname  | t_student.grade  |
+----------------+------------------+------------------+
+----------------+------------------+------------------+
stu01.txt
1,zhangsan,1
2,lisi,1
3,wangwu,1

stu02.txt
4,zhaoliu,2
5,lvqi,2
6,maba,2

stu03.txt
7,liuyan,3
8,tangyan,3
9,jinlian,3
-- 静态分区需要用户手动加载数据 并指定分区
load  data local  inpath '/root/stu01.txt' into table t_student partition(grade=1);
load  data local  inpath '/root/stu02.txt' into table t_student partition(grade=2);
load  data local  inpath '/root/stu03.txt' into table t_student partition(grade=3);
-- 查询
select * from t_student where grade=1;
+----------------+------------------+------------------+
| t_student.sid  | t_student.sname  | t_student.grade  |
+----------------+------------------+------------------+
| 1              | zhangsan         | 1                |
| 2              | lisi             | 1                |
| 3              | wangwu           | 1                |
+----------------+------------------+------------------+

image

注意:文件中的数据放入到哪个分区下就属于当前分区的数据,即使数据有误,也会按照当前分区处理

stu03.txt
7,liuyan,3
8,tangyan,3
9,jinlian,3
10.aaa,4

load  data local  inpath '/root/stu03.txt' overwrite into table t_student partition(grade=3);

select * from t_student where grade=3;
-- 最后一条记录虽然写的是4 但是 放到了年级3分区下 效果也是年级3
+----------------+------------------+------------------+
| t_student.sid  | t_student.sname  | t_student.grade  |
+----------------+------------------+------------------+
| 7              | liuyan           | 3                |
| 8              | tangyan          | 3                |
| 9              | jinlian          | 3                |
| 10             | aaa              | 3                |
+----------------+------------------+------------------+

2.创建多分区表

-- 创建学生表 分区字段为年级grade 班级clazz
CREATE TABLE  t_student02 (
    sid int,
    sname string
 ) partitioned by(grade int,clazz int)   -- 指定分区字段
row format delimited fields terminated by ',';
1年级1班
stu0101.txt  
1,zhangsan,1,1
2,lisi,1,1

1年级2班
stu0102.txt
3,wangwu,1,2

2年级1班
stu0201.txt
4,zhangsan,2,1
5,lisi,2,1
6,maba,2,1

3年级1班
stu0301.txt
7,liuyan,3,1
8,tangyan,3,1
3年级2班
9,dalang,3,2
10,jinlian,3,2
load  data local  inpath '/root/stu0101.txt' into table t_student02 partition(grade=1,clazz=1);
load  data local  inpath '/root/stu0102.txt' into table t_student02 partition(grade=1,clazz=2);
load  data local  inpath '/root/stu0201.txt' into table t_student02 partition(grade=2,clazz=1);
load  data local  inpath '/root/stu0301.txt' into table t_student02 partition(grade=3,clazz=1);
load  data local  inpath '/root/stu0302.txt' into table t_student02 partition(grade=3,clazz=2);

select * from t_student02 where grade=1 and clazz=2;
+------------------+--------------------+--------------------+--------------------+
| t_student02.sid  | t_student02.sname  | t_student02.grade  | t_student02.clazz  |
+------------------+--------------------+--------------------+--------------------+
| 7                | liuyan             | 3                  | 1                  |
| 8                | tangyan            | 3                  | 1                  |
+------------------+--------------------+--------------------+--------------------+

image

注意:我们既然建立了分区,就要保证分区查询的的命中率,查询尽量使用设置的分区字段去查询.分区虽然避免了全表扫描,但是也可能会产生大量的小文件,有利有弊.

3.分区其他操作(了解)

-- 查看分区 
show partitions t_student02;
-- 添加分区
alter table t_student02 add  partition (grade=4,clazz=1);
-- 删除分区
alter table t_student02 drop  partition (grade=4,clazz=1);

动态分区

静态分区与动态分区的主要区别在于静态分区是手动指定,而动态分区是通过数据来进行判断.

详细来说:静态分区需要我们自己手动load并指定分区,如果数据很多,那么是麻烦了.而动态分区指的是分区的字段值是基于查询结果(参数位置)自动推断出来的。核心语法就是insert+seclect。

开启动态分区首先要在hive会话中设置如下的参数

-- 临时设置 重新连接需要重新设置
set hive.exec.dynamic.partition=true; 
set hive.exec.dynamic.partition.mode=nonstrict;

其余参数配置如下:

设置为true表示开启动态分区的功能(默认为false) 
--hive.exec.dynamic.partition=true; 

设置为nonstrict,表示允许所有分区都是动态的(默认为strict) 严格模式至少有一个静态分区
-- hive.exec.dynamic.partition.mode=nonstrict; 

每个mapper或reducer可以创建的最大动态分区个数(默认为100) 
比如:源数据中包含了一年的数据,即day字段有365个值,那么该参数就需要设置成大于365,
如果使用默认 值100,则会报错 
--hive.exec.max.dynamic.partition.pernode=100; 

一个动态分区创建可以创建的最大动态分区个数(默认值1000) 
--hive.exec.max.dynamic.partitions=1000; 

全局可以创建的最大文件个数(默认值100000) 
--hive.exec.max.created.files=100000; 

当有空分区产生时,是否抛出异常(默认false) 
-- hive.error.on.empty.partition=false;

操作步骤

  1. 创建文件并上传
  2. 创建外部表指向文件(相当于临时表)
  3. 创建动态分区表
  4. 查询外部表将数据动态存入分区表中
创建文件并上传

student.txt  

1,zhangsan,1,1
2,lisi,1,1
3,wangwu,1,2
4,zhangsan,2,1
5,lisi,2,1
6,maba,2,1
7,liuyan,3,1
8,tangyan,3,1
9,dalang,3,2
10,jinlian,3,2

-- 将文件上传到hdfs根目录
hdfs dfs -put student.txt  /stu
创建外部表指向文件(相当于临时表)  
create external table t_stu_e(
    sid int,
    sname string,
    grade int,
    clazz int
)row format delimited fields terminated by ","
location "/stu";
创建动态分区表
create  table  t_stu_d(
    sid int,
    sname string
)partitioned by (grade int,clazz int)
row format delimited fields terminated by ",";

查询外部表将数据动态存入分区表中
insert overwrite table t_stu_d partition (grade,clazz) select  *  from t_stu_e ;

select * from t_stu_d;

image

分桶表

概述

分桶表也叫做桶表,叫法源自建表语法中bucket单词,是一种用于优化查询而设计的表类型。

分区提供一个隔离数据和优化查询的便利方式。不过,并非所有的数据集都可形成合理的分区。不合理的数据分区划分方式可能导致有的分区数据过多,而某些分区没有什么数据的尴尬情况 。分桶是将数据集分解为更容易管理的若干部分的另一种技术。
image
对Hive(Inceptor)表分桶可以将表中记录按分桶键(字段)的哈希值分散进多个文件中,这些小文件称为桶。桶以文件为单位管理数据!分区针对的是数据的存储路径;分桶针对的是数据文件。

分桶的原理

Hive采用对列值哈希,然后除以桶的个数求余的方式决定该条记录存放在哪个桶当中。

bucket num = hash_function(bucketing_column) mod   num_buckets
 分隔编号      哈希方法(分桶字段)              取模   分桶的个数

image

分桶的好处

  1. 基于分桶字段查询时,减少全表扫描.

  2. 根据join的字段对表进行分桶操作,join时可以提高MR程序效率,减少笛卡尔积数量.

image

  1. 分桶表数据进行高效抽样.数据量大时,使用抽样数据估计和推断整体特性.

分桶表的创建

1.准备person.txt上传到hdfs
2.创建外部表指向person.txt
3.创建分桶表
4.查询外部表将数据加载到分桶表中
person.txt 
public class Test02 {
    public static void main(String[] args) {
        for (int i = 1; i <= 10000; i++) {
            System.out.println(i + "," + "liuyan" + (new Random().nextInt(10000) + 10000));
        }
    }
}

 hdfs dfs -mkdir /person
hdfs dfs -put person.txt /person
2.创建外部表指向person.txt
create external table  t_person_e(
     id int,
     pname string
) row format delimited fields terminated by ","
    location "/person";

select  * from t_person_e;
create table  t_person(
    id int,
    pname string
)clustered by(id) sorted by (pname) into 24 buckets
row format delimited fields terminated by ",";
insert overwrite table t_person select * from t_person_e ;

image

桶表抽样

-- tablesample是抽样语句,语法:TABLESAMPLE(BUCKET x OUT OF y) 
-- x表示从哪个bucket开始抽取。
   例如,table总bucket数为32,tablesample(bucket 3 out of 16)
   32 / 16  = 2  代表16桶为一组  抽取 第一组的第3桶  抽取第二组的第3桶 也就是第19桶
-- y必须是table总bucket数的倍数或者因子。hive根据y的大小,决定抽样的比例。
    tablesample(bucket 3 out of 64)
    32/64 = 2分之一      64桶为一组  不够一组 取第三桶的 前百分之50
    
    select * from t_person tablesample(bucket 4 out of 12); 
    24/12 抽取2桶数据      12桶一组 抽取 第一组第4桶 第二组 第4桶 4+12 =16桶
本文转载于网络 如有侵权请联系删除

相关文章

  • redis 主从架构(sizeof函数怎么计算)

    大家好,又见面了,我是你们的朋友全栈君。一.绪论Redis的复制功能是基于内存快照的持久化策略基础上的,也就是说无论你的持久化策略选择的是什么,只要用到了Redis的复制功能,就一定会有内存快照发生。 当Slave启动并连接到Master之后,它将主动发送一个SYNC命令(首先Master会启动一个后台进程,将数据快照保存到文件中[rdb文件]Master会给Slave发送一个Ping命令来判断Slave的存活状态当存活时Master会将数据文件发送给Slave并将所有写命令发送到Slave)。Slave首先会将数据文件保存到本地之后再将数据加载到内存中。当第一次链接或者是故障后重新连接都会先判断Slave的存活状态在做全部数据的同步,之后只会同步Master的写操作(将命令发送给Slave)二.优点1.在一个Redis集群中,master负责写请求,slave负责读请求,这么做一方面通过将读请求分散到其他机器从而大大减少了master服务器的压力,另一方面slave专注于提供读服务从而提高了响应和读取速度。 2.在一个Redis集群中,如果master宕机,slave可以介入并取代m

  • Gogs基本操作使用

    Gogs简介 Gogs是一款类似GitHub的开源文件/代码管理系统(基于Git),Gogs的目标是打造一个最简单、最快速和最轻松的方式搭建自助Git服务。使用Go语言开发使得Gogs能够通过独立的二进制分发,并且支持Go语言支持的所有平台,包括Linux、MacOSX、Windows以及ARM平台。 阅读目录: 1、登录&注册 2、页面基本功能介绍 2.1创建新的仓库 2.2仓库使用基本说明介绍 2.3组织管理功能 3、配置SSH密钥登录 基本功能介绍 1)远程代码仓库管理 2)代码仓库权限分配、管理 3)团队管理 4)代码审查1、登录&注册2、页面基本功能介绍 主面板--控制面板 我的仓库【表示自己个人账户下的仓库(所有权属于自己)】 参与协作的仓库【表示自己参与的仓库(所有权不属于自己)权限由创建仓库者分配】 左边的是个人操作日志 注意: 自己的仓库有对仓库设置的所有权 管理设置 管理协作 管理分支 管理Web钩子 管理Git钩子 管理部署密钥 转移仓库所有权主页面--工单管理 这里有属于你自己用户的仓库工单和指派给您的工单和由您创建的工单信息 主页面--发现 发

  • 【全景分割】开源 | 台湾国立大学 EPSNet:具有跨层注意力融合的高效全景分割网络

    获取完整原文和代码,公众号回复:09020890814论文地址:http://arxiv.org/pdf/2003.10142v3.pdf代码:公众号回复:09020890814来源:台湾国立大学论文名称:EPSNet:EfficientPanopticSegmentationNetworkwithCross-layerAttentionFusion原文作者:Chia-YuanChang内容提要全景图像分割是融合了独立的语义分割和实例分割的任务。然而,目前最先进的研究并没有过多地关注推理时间的问题。本文中,我们提出了一种高效的全景分割网络(EPSNet),来提高全景分割任务的推理速度。在EPSNet网络中主要是基于原型掩模和掩模系数的简单线性组合。用于实例分割和语义分割的轻量级网络分支只需要预测掩码系数,并利用原型网络分支预测的共享原型生成掩码。用于实例分割的轻量级网络分支而语义分割只需要预测掩码系数和根据原型网络分支预测的共享原型来制作面具。此外,为了提高共享原型的质量,我们采用了一个叫做“跨层注意力融合模块”的模块以注意机制帮助聚集多尺度特征,该模块捕捉了彼此之间的长期依赖关系。为

  • leetcode之判断能否形成等差数列

    序本文主要记录一下leetcode之判断能否形成等差数列题目给你一个数字数组arr。 如果一个数列中,任意相邻两项的差总等于同一个常数,那么这个数列就称为等差数列。 如果可以重新排列数组形成等差数列,请返回true;否则,返回false。 示例1: 输入:arr=[3,5,1] 输出:true 解释:对数组重新排序得到[1,3,5]或者[5,3,1],任意相邻两项的差分别为2或-2,可以形成等差数列。 示例2: 输入:arr=[1,2,4] 输出:false 解释:无法通过重新排序得到等差数列。 提示: 2<=arr.length<=1000 -10^6<=arr[i]<=10^6 来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/can-make-arithmetic-progression-from-sequence 著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。 复制题解classSolution{ publicbooleancanMakeArithmetic

  • 【LeetCode程序员面试金典】面试题 08.11. Coin LCCI

    Givenaninfinitenumberofquarters(25cents),dimes(10cents),nickels(5cents),andpennies(1cent),writecodetocalculatethenumberofwaysofrepresentingncents.(Theresultmaybelarge,soyoushouldreturnitmodulo1000000007)Example1:Input:n=5 Output:2 Explanation:Therearetwoways: 5=5 5=1+1+1+1+1 Example2:Input:n=10 Output:4 Explanation:Therearefourways: 10=10 10=5+5 10=5+1+1+1+1+1 10=1+1+1+1+1+1+1+1+1+1 Notes:Youcanassume:0<=n<=1000000来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/coin-lcci 著作权归领扣网络所有。商业转

  • 移动端数据统计,精细化运营的永动机

    前言随着移动互联网市场快速发展,以往“跑马圈地”式的粗犷运营时代已成为过去时。大环境的改变,也导致移动端的数据统计分析在产品的研发、决策、运营等方面起着越来越重要的作用,“精细化运营”一时间成为热点词——从大厂到创业团队,无论是自建数据统计系统还是借助于第三方,市场对于简单易用、稳定可靠数据统计方案的需求从未衰减过。挑战产品运营人员目前迫切地需要更加详尽、多维的移动端数据,同时期望数据能够以直观清晰的方式展现。若是自建应用数据统计系统,则少不了多方的配合与协助:开发人员需要在数据获取方面下一定功夫,尤其是针对无埋点的统计需求;数据人员则需要承担海量数据分析的艰巨任务,部分小型团队缺乏数据相关的岗位,只能将这项工作交给服务器端同学来完成,但后者相对缺乏大数据分析经验与能力,难以保证分析质量。因此个人认为,当团队的资源有限时,可以考虑寻求专业的第三方解决方案,既能够让研发同学不必为了不断变更的数据统计需求而绞尽脑汁,也能够让产品运营同事在更专业的数据结果中抽丝剥茧。数据统计分析从前,移动端的数据主要来自于两个主流系统的应用:iOS应用和Android应用;而最近,十大厂商在大力推广基于An

  • Java开发 2019秋招 面经整理

    从7月底开始,到10月中旬获得offer进入面试流程的包括字节跳动、招银科技、百度、Keep、华为、花旗、京东、有赞、去哪儿、拼多多、okcoin,收到的offer有华为、招银、有赞、去哪儿,其他有一面凉、二面凉以及HR面凉等等。面试中遇到的问题整理如下,仅供参考计算机网络TCP、UDP在哪一层?它们之间有什么差别,哪一个传输效率更高,为什么?分别用于什么场景?HTTP和HTTPS的差别,在哪一层?HTTPS怎么保证安全,服务器怎么把证书给客户端?计算机网络五层结构每层做什么,分别介绍一下IPV4和IPV6区别网络层数据包的头部有哪些TCP中的timewaitTCP三次握手,四次挥手流程,其中的状态TCP过期时间TCP头部有哪些IP报文头部信息HTTPS的证书在哪里下载在浏览器中输入www.xxx.com的过程POST和GET的区别HTTP状态码500的含义,其他状态码了解么HTTP怎么创建长连接TCPread函数怎么创建进程TCP包大小UDP,1兆大小的数据可以直接传输么IP包大小HTTP1.1和HTTP2的特点TCP怎么保持可靠的操作系统进程和线程的差别线程可以用到进程的哪些资源进

  • 聊聊怎么阅读SDWebImage源码

    关于SDWebImage的介绍就不多说了,网上很多。我们主要聊聊怎么阅读SDWebImage的源码。 阅读源码前首先我们要思考几个问题: 1.SDWebImage的下载流程是怎么样的? 2.SDWebImage怎么处理多线程并发? 3.SDWebImage怎么处理缓存? 4.SDWebImage怎么设置图片? 5.缓存多久?1.SDWebImage的下载流程是怎么样的? 下载流程分两个部分来讲,首先来说缓存查询流程,如图:查询缓存.jpg1.首先查内存缓存主要代码//Firstcheckthein-memorycache... UIImage*image=[selfimageFromMemoryCacheForKey:key]; BOOLshouldQueryMemoryOnly=(image&&!(options&SDImageCacheQueryDataWhenInMemory)); if(shouldQueryMemoryOnly){ if(doneBlock){ doneBlock(image,nil,SDImageCacheTypeMemory); }

  • Python操作Mysql类

    #!/usr/bin/python #-*-coding:UTF-8-*- importMySQLdb fromwarningsimportfilterwarnings filterwarnings('error',category=MySQLdb.Warning) classMySQL: __conn=None __cursor=None def__init__(self,host,user,passwd,db,port=3306,charset='utf8'): try: self.__conn=MySQLdb.connect(host=host,user=user,passwd=passwd,db=db,port=port,charset=charset) self.__cursor=self.__conn.cursor() exceptMySQLdb.Warning,w: print"警告信息%s"%str(w) exceptMySQLdb.Error,e: print"错误信息%d%s"%(

  • Golang实现类似Scan或者Scanf功能

    packagemain import( _"errors" "fmt" "io" "os" "syscall" "time" "bytes" _"os/exec" "github.com/docker/docker/pkg/term" ) funcmain(){ Stdin() } funcStdin(){ varinio.Reader in=os.NewFile(uintptr(syscall.Stdin),"/dev/stdin") _,ok:=term.GetFdInfo(in) ifok{ fmt.Println("Isterminal\n") } reader:=bytes.NewBuffer(make([]byte,10)) for{ data,_:=reader.ReadFrom(in)//很奇怪为什么一直阻塞在这里 fmt.Printf

  • 一条sql语句导致的数据库宕机问题及分析(42天)

    之前分享过一篇博文,是一条sql语句"导致"的数据库宕机,上次是另有原因,这次真碰到一个案例,而且是在重要的环境上,希望大家引以为戒。 数据库是基于Linux64的版本,版本是11.2.0.2.0,已经打了最新的psu. 数据库的访问用户数大约在1000左右,当时查看服务器的cpu已经是100%了,有大约10个进程都是cpu100%,数据库逻辑读也是超高,一秒钟大约是接近百兆的情况,sga是12G,已用了sga的自动管理(sga_target=0),查看内存组件时发现buffer_cache已经有shrink的迹象,而且buffer_cache的min_size还是有一点小,就在可用范围内给buffercache增大了几百兆的样子,生成了一个ADDM,报告里第一条就是希望设置sga_target为一个特定的值,性能可能会有一定的提升,当时想,sga_max_size都已经是12G了,设置sga_target=12G也没有问题吧 就按照它的提示做了, altersystemsetsga_target=12G; 结果命令提顿了几秒钟,然后就崩出来一个end_of_com

  • Kubernetes---Volume存储卷

    一、Volume存储卷简介 Volume将容器中的指定数据和容器解耦,并将数据存储到指定的位置,不同的存储卷功能不一样,如果是基于网络存储的存储卷可以可实现容器间的数据共享和持久化。静态存储卷需要在使用前手动创建PV和PVC,然后绑定至pod使用。常用的几种卷: Secret:是一种包含少量敏感信息例如密码、令牌或密钥的对象 configmap:配置文件 emptyDir:本地临时卷 hostPath:本地存储卷 nfs等:网络存储卷 官方介绍:https://kubernetes.io/zh/docs/concepts/storage/volumes/ 二、emptyDir测试     当Pod被分配给节点时,首先创建emptyDir卷,并且只要该Pod在该节点上运行,该卷就会存在,正如卷的名字所述,它最初是空的,Pod中的容器可以读取和写入emptyDir卷中的相同文件,尽管该卷可以挂载到每个容器中的相同或不同路径上。当出于任何原因从节点中删除Pod时,emptyDir中的数据将被永久删除。  emptyDir测试 r

  • 11.6学习笔记

    复习一下mysql语句: 查询单行?select*from'表名'whereid="值"; 查询0,5?select*from'表名'limit0,5 查询满足用户名和密码匹配?select*fromadminwhere`username`='值'and`password`="值"; 添加用户?insertinto`表名`values('值1','值2','值3'。。。) 删除用户?deletefrom`表名`whereid="值"; 既要排序(降序)做前5条数据的查询? select*from`表名`orderbyiddesclimit0,5;   oop思想面向对象面向对象(Object)(1)重用性、灵活性和扩展性 (2)万事万物皆对象 对象:人类 属性:姓名年龄 方法:吃喝玩 (3)声明一个类(对象)class类名{ }$m=new类名;//new:实例实例化得到一个对象,后面的()是在没有参数的情况下是可要可不要。var_wanmp($m);//返回的数据类型是object 对象返回的数据类型是object类型 类名:命名规则(不能以数字开头,不要使用关键字,不要用

  • 分布式:2PC,3PC,Paxos,Raft,ISR [转]

    本文主要讲述2PC及3PC,以及Paxos以及Raft协议。 两类一致性(操作原子性与副本一致性) 2PC协议用于保证属于多个数据分片上的操作的原子性。这些数据分片可能分布在不同的服务器上,2PC协议保证多台服务器上的操作要么全部成功,要么全部失败。 Paxos协议用于保证同一个数据分片的多个副本之间的数据一致性。当这些副本分布到不同的数据中心时,这个需求尤其强烈。 一、2PC(阻塞、数据不一致问题、单点问题) Two-Phase Commit,两阶段提交复制 1、阶段一:提交事务请求(投票阶段) (1)事务询问 协调者向所有的参与者发送事务内容,询问是否可以执行事务提交操作,并开始等待各参与者的响应复制 (2)执行事务 各参与者节点执行事务操作,并将Undo和Redo信息计入事务日志中复制 (3)各参与者向协调者反馈事务询问的响应 如果参与者成功执行了事务操作,那么就反馈给协调者Yes响应,表示事务可以执行;如果参与者没有成功执行事务,那么就反馈给协调者No响应,表示事务不可以执行。复制 2、阶段二:执行事务提交(执行阶段) (1)执行事务提交  

  • java Dubbo

      Dubbo   架构演变     Dubbo概念   单一应用架构   当网站流量很小时,只需一个应用,将所有功能都部署在一起,以减少部署节点和成本。此时,用于简化增删改查工作量的数据访问框架(ORM)是关键。       垂直应用架构   当访问量逐渐增大,单一应用增加机器带来的加速度越来越小,提升效率的方法之一是将应用拆成互不相干的几个应用,以提升效率。此时,用于加速前端页面开发的Web框架(MVC)是关键。       分布式服务架构   当垂直应用越来越多,应用之间交互不可避免,将核心业务抽取出来,作为独立的服务,逐渐形成稳定的服务中心,使前端应用能更快速的响应多变的市场需求。此时,用于提高业务复用及整合的分布式服务框架(RPC)是关键。       流动计算架构   当服务越来越多,容量的评估,小服务资源的浪费等问题逐渐显现,此时需增加一个调度中心基于访问压力实时管理集群容量,提高集群利用率。

  • pgm终

    这里罗列一些看完此书后遗留的问题: 常用model通过BP/LBP重新审视inference部分 Lauritzenalgorithm/Lauritzen-Spiegelhalteralgorithm turbocodec与LBP Gaussianprocesses与GaussianMRF,上面的EP BDeprior Dirichletprocess Markovlogicnets上的structurelearning与training/inference causalmodels 嗯,革命尚未成功,同志仍需努力! ——————-Andhesaid,Laynotyourhandonthelad,neitherdoyouanythingtohim:fornowIknowthatyoufearGod,seeingyouhavenotwithheldyourson,youronlysonfromme.

  • [Hadoop in Action] 第6章 编程实践

    Hadoop程序开发的独门绝技 在本地,伪分布和全分布模式下调试程序 程序输出的完整性检查和回归测试 日志和监控 性能调优   1、开发MapReduce程序   [本地模式]      本地模式下的hadoop将所有的运行都放在一个单独的Java虚拟机中完成,并且使用的是本地文件系统(非HDFS)。在本地模式中运行的程序将所有的日志和错误信息都输出到控制台,最后它会给出所处理数据的总量。   对程序进行正确性检查: 完整性检查 回归测试 考虑使用long而非int     [伪分布模式]   本地模式不具备生产型hadoop集群的分布式特征。一些bug在运行本地模式时是不会出现的。现在是通过日志文件和web界面远程监视它,这些工具和以后在监控生产集群时用的工具是相同的。   2、生产集群上的监视和调试   [计数器]   代码清单使用计数器统计缺失值个数的MapClass   1importjava.io.IOException;

  • 如何测试一个杯子

    一需求:   测试一个带广告图案的花纸杯   二相关背景:   1.杯子特性:   (1)杯子的容量:能装多少升水,空杯,半杯,满杯   (2)杯子的型状:圆型,上面口大,下面小。   (3)杯子的材料:纸杯   (4)杯子的抗摔能力:风吹是否会倒,摔一次是否会摔坏,摔多次是否会摔坏 (5)杯子的耐温性:装冷水,冰水,热水  2.GUI测试:   (1)广告内容与图案碰水是否会掉色   (2)广告内容与图案是否正当,是否吸引人(广告嘛),赏心悦目; (3)广告内容与图案是否轻易剥落   三影响范围:   1.可用性:   (1)装进液体多久后会漏水   (2)装进热水多久后可以变温,装进冰多久后可以融化   2.安全性:   (1)装进不同液体,是否会有化学反应。比如:可

  • 正则表达式

    参考教程 在线验证网址 匹配单个字符 .表示要匹配除了换行符之外的任何单个字符。 #案例 苹果是绿色的 .色会匹配绿色 复制 代码案例 content='''苹果是绿色的 橙子是橙色的 香蕉是黄色的 乌鸦是黑色的''' importre p=re.compile(r'.色') foroneinp.findall(content): print(one) 复制 匹配多个字符 *表示匹配前面的子表达式任意次,包括0次。 #案例:色字出现0次或多次 苹果是绿色色的 色*会匹配色色 #案例:任意单个字符出现多次 苹果是绿色色的 绿.*会匹配绿色色的 复制 匹配多个字符 +表示匹配前面的子表达式一次或多次,不包括0次。 #案例:色字出现至少1次或多次 苹果是绿色色的 色+会匹配色色 #案例:任意单个字符出现多次 乌鸦,是黑色的 猴子, ,.+会匹配,是黑色的 复制 匹配指定次数 表达式油{3}就表示匹配连续的油字3次 表达式油{3,4}就表示匹配连续的油字至少3次,至多4次 复制 贪婪模式 #匹配所有html标签,结果为['<html>

  • c#结构

     classclass1//类   {   }   interfaceinterface1//接口   {   }   structstruct1//结构   {   }   delegateintdelegate1();//委托   enumEnum1   {}     classProgram//类   {            staticvoidMain(string[]args)//Main方法必须为静态方法 可以void(无返回参数)或者int

  • GF(2^8)有限域模乘的verilog组合逻辑实现

    wire[7:0]x,y; wire[7:0]z; assignz={ x[7]&y[0]^x[6]&y[1]^x[5]&y[2]^x[4]&y[3]^(x[7]^x[3])&y[4]^(x[7]^x[6]^x[2])&y[5]^(x[6]^x[5]^x[1])&y[6]^(x[7]^x[5]^x[4]^x[0])&y[7], x[6]&y[0]^x[5]&y[1]^x[4]&y[2]^(x[1]^x[3])&y[3]^(x[7]^x[6]^x[2])&y[4]^(x[6]^x[4]^x[1])&y[5]^(x[7]^x[5]^x[4]^x[0])&y[6]^(x[3]^x[4]^x[6])&y[7], x[5]&y[0]^x[4]&y[1]^(x[7]^x[3])&y[2]^(x[7]^x[6]^x[2])&y[3]^(x[6]^x[4]^x[1])&y[4]^(x[7]^x[5]^x[4]^x[0])&

相关推荐

推荐阅读