Организация Apache Software Foundation анонсировала [3] релиз распределенной БД Apache Cassandra 1.0 [4], относящейся к классу noSQL-систем и рассчитанной на создание высокомасштабируемых и надежных хранилищ огромных массивов данных, представленных в виде хэша. Изначально проект был разработан в недрах Facebook и в 2009 году передан под покровительство фонда Apache. Промышленные решения на базе Cassandra развернуты для обеспечения сервисов таких компаний, как Cisco, IBM, Cloudkick, Reddit, Digg, Rackspace и Twitter. Наиболее крупный кластер серверов, обслуживающих единую БД Cassandra, размер данных в которой превышает 300 Тб, насчитывает более 400 машин.
БД Cassandra написана на языке Java и объединяет в себе полностью распределенную hash-систему Dynamo, обеспечивающую практически линейную масштабируемость при увеличении объема данных. Cassandra использует модель хранения данных на базе семейства столбцов (ColumnFamily), отличающуюся от систем подобных memcachedb, которые хранят данные только в связке ключ/значение, возможностью организовать хранение хэшей с несколькими уровнями вложенности. Cassandra относится к категории хранилищ повышенно устойчивых к сбоям: помещаемые в БД данные автоматически реплицируются на несколько узлов распределенной сети или даже равномерно распределяются по нескольким дата-центрам. При сбое узла, его функции на лету подхватываются другими узлами. Добавление новых узлов в кластер и обновление версии Cassandra производится на лету, без дополнительного ручного вмешательства и переконфигурирования других узлов.
Для упрощения взаимодействия с БД поддерживается язык формирования структурированных запросов CQL [5] (Cassandra Query Language), на первый взгляд напоминающий SQL, но существенно урезанный по функциональности. Например, можно выполнять только простейшие запросы SELECT с выборкой по определенному условию, но без поддержки сортировки и группировки. Добавление и обновление данных производится через единое выражение UPDATE, операция INSERT отсутствует (если записи нет, при выполнении UPDATE она создается). Из возможностей можно отметить поддержку пространств имен и семейств столбцов, создание индексов через выражение "CREATE INDEX". Драйверы с поддержкой CQL подготовлены для языков Python [6], Java [7] (JDBC/DBAPI2) и JavaScript [7] (Node.js).
Ключевые [8] новшества [9] Cassandra 1.0:
Ссылки:
[1] http://htfl.ru/cat-news-apache
[2] http://htfl.ru/cat-news-novosti-po
[3] /out.php?link=https://blogs.apache.org/foundation/entry/the_apache_software_foundation_announces18
[4] /out.php?link=http://cassandra.apache.org/
[5] /out.php?link=http://crlog.info/2011/03/29/cassandra-query-language-aka-cql-syntax/
[6] /out.php?link=http://www.apache.org/dist/cassandra/drivers
[7] /out.php?link=https://github.com/racker/node-cassandra-client
[8] /out.php?link=http://www.mail-archive.com/user%40cassandra.apache.org/msg18093.html
[9] /out.php?link=https://svn.apache.org/viewvc/cassandra/branches/cassandra-1.0/NEWS.txt?view=co
[10] http://htfl.ru/news/kompaniya-google-otkryla-iskhodnye-teksty-bd-leveldb