cassandra数据迁移有好多种方法,只要你的sstable文件没有丢失,这里只讲述两种常见易用的方式:
第一种方式:copy命令
使用方法:适用于数据量小的情况下。
使用方式:
copy mykeyspace.mytable to ‘/home/db.csv’
这样就成功的把表mytable以csv的格式导出到了db.csv文件。
然后再另外一个集群中,建一个一模一样的表,然后使用
copy app12345.mytable from ‘/home/db.csv’
就把数据导入到了新的库中。
不过以上方式仅限于小数据量,当数据量一大,这个过程会持续很久,而且文件也会很大。
第二种方式:sstableloader工具。
在cassandra的bin目录下提供了一个sstableloader工具,这个工具专门用于把一个表的sstable文件导入到一个新的集群中。
假设你的表是mykeyspace.mytable。你的数据存一个10个节点组成的集群中,每个几点的数据都存在/disk/data1和/disk/data2目录下。
假设你的新集群的一个访问地址是192.168.2.1, 先在新集群建离相同名字的keyspace和表结构。
接下来你只要在老集群的每个节点执行下面的命令:
bin/sstableloader -d 192.168.2.1 -u cassandra -pw cassandra -t 100 /disk/data1/mykeyspace/mytable
bin/sstableloader -d 192.168.2.1 -u cassandra -pw cassandra -t 100 /disk/data2/mykeyspace/mytable
其中-u是 用户名 -pw是密码 -t是限制流量100M/bps
等所有节点执行完毕,你的表数据就成功导入到了新的集群中,当然只要你的机器io和网络条件允许,你可以多个节点并发执行。
相关推荐
通过实例介绍了cassandra的简单配置
Cassandra的主要特点就是它不是一个数据库,而是由一堆数据库节点共同构成的一个分布式网络服务,对Cassandra 的一个写操作,会被复制到其他节点上去,对Cassandra的读操作,也会被路由到某个节点上面去读取。...
Cassandra的主要特点就是它不是一个数据库,而是由一堆数据库节点共同构成的一个分布式网络服务,对Cassandra 的一个写操作,会被复制到其他节点上去,对Cassandra的读操作,也会被路由到某个节点上面去读取。对于一...
CCM一个脚本可以在本机上轻松创建和销毁Apache Cassandra集群
该项目展示了如何连接到多节点 cassandra 集群。 集群由 CCM(Cassandra Cluster Manager)管理。 创建杂波和数据模型 这里是我用来使用 ccm 创建集群的命令: ccm create cluster_test_1 -v 2.0.12 ccm populate...
token是cassandra里相当重要的一个概念,它是cassandra用来平衡集群内各节点负载的一个属性。cassandra里有不同的token分配策略,推荐采用默认的RandomPartitioner分区策略。在这个策略下,token是一个0~2的127次方...
一个带有 Docker-compose 的小型多直流 Cassandra 集群 :party_popper: 是的,另一个 Docker-Cassandra 集群... Docker 镜像 映像基于并进行了更改以支持多个数据中心。 Ops Center 目前已禁用,但我希望有时间...
它最初由Facebook开发,用于储存收件箱等简单格式数据,此后,由于Cassandra良好的可扩展性,逐渐发展成为了一种流行的分布式结构化数据存储方案。 2、特点分析 弹性可扩展性 Cassandra是高度可扩展的;它允许添加更...
Cassandra是一个混合型的非关系的数据库,类似于Google的BigTable。其主要功能比Dynamo (分布式的Key-Value存储系统)更丰富,但支持度却不如文档存储MongoDB(介于关系数据库和非关系数据库之间的开源产品,是非...
cassandra 实战cassandra 实战cassandra 实战cassandra 实战cassandra 实战cassandra 实战cassandra 实战cassandra 实战cassandra 实战cassandra 实战cassandra 实战cassandra 实战cassandra 实战cassandra 实战...
关于分布式NoSQL数据库Cassandra的讲解,来自Consumer SkyAid Team。
Cassandra是一个混合型的非关系的数据库,类似于Google的BigTable。其主要功能比Dynamo (分布式的Key-Value存储系统)更丰富,但支持度却不如文档存储MongoDB(介于关系数据库和非关系数据库之间的开源产品,是非...
Kubernetes上的可扩展Cassandra部署:在此代码中,我们提供了在Kubernetes上部署多节点可扩展Cassandra集群的完整路线图。 Cassandra知道它正在集群管理器中运行,并使用此集群管理基础结构来帮助实现该应用程序。 ...
一组Cassandra工具,用于备份、恢复、监控、修复和管理ApacheCassandraDatastax集群_Jinj.zip
nosql数据库cassandra入门的一个例子。包括简单的插入、查询、建立keyspace等
在 Cassandra 写入数据之前,需要先记录日志 ( CommitLog ),然后数据开始写入到 Column Family 对应的 Memtable 中,Memtable 是一种按照 key 排序数据的内存结构,在满足一定条件时,再把 Memtable 的数据批量的...
CassandraUnit是一个Cassandra数据操作的单元测试框架,其功能与关系型数据库测试框架DBunit类似,只是其测试对象是Cassandra,下面是一个最简单使用例子: 创建一个用于存储数据的xml文件,命名为 simpleDataSet....
The rising popularity of Apache Cassandra rests on its ability to handle very large data sets that include hundreds of terabytes -- and that's why this distributed database has been chosen by ...
CCM(Cassandra集群管理器) 在本地主机上创建,启动和删除Apache Cassandra集群的脚本/库。 ccm和ccmlib的目标是使在本地机器上轻松创建,管理和销毁小型Cassandra群集变得容易。 它旨在测试Cassandra集群。要求...
DevCenter cassandra客户端 DevCenter cassandra客户端 DevCenter cassandra客户端