cellessentialgreenssource是什么意思?

1.根据cell的源码分析

column family中文翻译是列族, 其实我的理解就一个列了

type是指操作类型, 一般都是写操作会被赋予类型, 读操作则没有. 类型一般是"put", "delete"需要更改数据的.

mvcc version. multiple version control concurrency. 多版本并发控制. 因为数据有哆个版本, 所以可以保证每次数据读取都会读到, 而不用因为锁而需要等待神马的, 而且是能读到的数据中最新的. (有可能数据正在背修改, 但因为沒有被commited, 所以不会被看到)

value就是这个row中存放的值, 这个很容易理解.

第一个和第三个不用解释, 大家都清楚; 第二个就是获取信息在数组中第一次出现嘚位置, 例如可以数组中row的第一个信息在index 5, 则getRowOffset()则等于5.

诶? 第三个什么鬼? sequenceId是Hadoop的HDFS中存储数据需要用到的信息. 所以这里的sequenceId是作用于当数据需要写入到HFile的這个阶段.

由于Cell是最基本, 也可以说最底层的物理存储模式. 所以以上所有信息的存储单位就是Byte, 一个字节. 所以对应的数组也是byte arrays.

顺带一题, 每个信息嘚arrays长度是有限制的.

(顺带复习一下Java基础类型吧→ →,:

计算长度时, 只需要2的n bits次方除以2, 因为考虑到负数.


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

我要回帖

更多关于 cellessential 的文章

 

随机推荐