URL: https://www.opennet.dev/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 120364
[ Назад ]

Исходное сообщение
"Выпуск СУБД TimescaleDB 1.7"

Отправлено opennews , 18-Апр-20 10:48 
Опубликован   выпуск СУБД TimescaleDB 1.7, предназначенной для хранения и обработки данных в форме временного ряда (срезы значений параметров через заданные промежутки времени, запись образует время и набор соответствующих этому времени значений). Подобная форма хранения оптимальна для таких применений как системы мониторинга, торговые платформы, системы сбора метрик и состояний датчиков. Предоставляются средства для интеграции с проектом Grafana и Prometheus...

Подробнее: https://www.opennet.dev/opennews/art.shtml?num=52759


Содержание

Сообщения в этом обсуждении
"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 18-Апр-20 10:48 
Годнота

"Выпуск СУБД TimescaleDB 1.7"
Отправлено анонимчик , 18-Апр-20 12:38 
и чем же оно годнота? тем что поверх pgsql - а на кой ляд во временных рядах возможность изменения данных.

"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 18-Апр-20 13:44 
Подскажи тогда годноту, если ты такой эксперт

"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 18-Апр-20 14:01 
Victoriametrics.

"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 18-Апр-20 16:24 
А если мне нужно не для метрик, а для исторических данных на десятки терабайт?

"Выпуск СУБД TimescaleDB 1.7"
Отправлено нах. , 18-Апр-20 18:22 
> А если мне нужно не для метрик, а для исторических данных на
> десятки терабайт?

а sql им зачем?


"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 18-Апр-20 20:40 
Для запросов

"Выпуск СУБД TimescaleDB 1.7"
Отправлено нах. , 19-Апр-20 10:00 
а теперь расскажи нам, как выглядит запрос к бд с метрикой, снимающеся раз в, допустим, пять минут, чтобы нарисовать график ее изменения за год.

Если ты хотя бы немножко умеешь кодить - ты поймешь, почему sql для этой цели абсолютно неудачный выбор. Если еще и математику в школе учил - вспомни что такое "скрытый экстремум", выкинь мысленно уже написанный тобой гуанокод и начинай заново.

Если в школе ты учил только основы религиозных культур, а кодить умеешь только в .md, то можешь не морщить лобик.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 19-Апр-20 19:51 
Скрытый экстремум сам придумал?

"Выпуск СУБД TimescaleDB 1.7"
Отправлено нах. , 19-Апр-20 22:41 
ну просто намек, что очевидный алгоритм "в лоб" будет неверным - "съест" резкие отклонения, которые мы как раз, наверное, хотим увидеть, можно неточными.

На мой взгляд правильного ответа в рамках sql и единственной таблицы timestamp,value - не существует в принципе.



"Выпуск СУБД TimescaleDB 1.7"
Отправлено DeadMustdie , 19-Апр-20 21:04 
> а sql им зачем?

Чтобы самим не писать вручную алгоритмы доступа к данным, включая миллионную в мире кривую реализацию Hash Merge.

А оный Merge возникнет рано или поздно при сопоставении разных групп наблюдений.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено нах. , 19-Апр-20 22:54 
> А оный Merge возникнет рано или поздно при сопоставении разных групп наблюдений.

хренассе... а точно-точно timescale это то, что подходит для подобных данных?

(просто вроде принято считать, что если в sql запросе возникает hash merge, это чаще всего признак неправильной структуры базы, и даже "прямая" реализация тут плохо помогает - все равно это худший вариант)


"Выпуск СУБД TimescaleDB 1.7"
Отправлено DeadMustdie , 19-Апр-20 23:35 
> хренассе... а точно-точно timescale это то, что подходит для подобных данных?

Агрегировать и фильтровать умеет, результат в виде таблицы выдаёт. Дальше вопрос уже к постгресу.

> (просто вроде принято считать, что если в sql запросе возникает hash merge,
> это чаще всего признак неправильной структуры базы, и даже "прямая" реализация
> тут плохо помогает - все равно это худший вариант)

Это верно лишь для трансакционных систем. Аналитические хранилища строят по другим принципам, и там сканирование таблиц (в поколоночном варианте - столбцов) скорее правило, чем исключение.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено Lex , 18-Апр-20 20:25 
“ и чем же оно годнота? тем что поверх pgsql - а на кой ляд во временных рядах возможность изменения данных.“ ?

Ви таки собрались изменять «исторические данные» задним числом ?


"Выпуск СУБД TimescaleDB 1.7"
Отправлено funny.falcon , 19-Апр-20 09:24 
Не вопрос. Подскажи что-нибудь для хранения исторических данных и разнообразных запросов к ним без возможности изменения.

"Выпуск СУБД TimescaleDB 1.7"
Отправлено qsdg , 21-Апр-20 17:35 
Victoriametrics же выше сказали. Отключай автоматический ретеншн, и будут твои данные "историческими".

"Выпуск СУБД TimescaleDB 1.7"
Отправлено funny.falcon , 19-Апр-20 09:26 
А друшой момент: бывают данные не срвсем исторические, но скорость изменения которых падает пропорционально их возрасту.

"Выпуск СУБД TimescaleDB 1.7"
Отправлено Алексей Морозов , 19-Апр-20 16:36 
Не мы такие, жись такая.

Вот идет поток, скажем, от GPS-трекера. И все бы хорошо, но время от времени этот чертов трекер начинает досылать данные, накопленные в своем черном ящике,


"Выпуск СУБД TimescaleDB 1.7"
Отправлено нах. , 19-Апр-20 22:56 
а где тут "изменение данных" ? Просто добавление не синхронное же.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено qsdg , 21-Апр-20 17:45 
> А если мне нужно не для метрик, а для исторических данных на
> десятки терабайт?

В подходящей базе десятки терабайт превращаются в просто терабайты, а если повезёт, то и в гигабайты, за счёт data-aware компрессии.

Для olap -- кликхаус. Для метрик -- victoriametrics.

У таймскейла вообще никакая компрессия, всё время тормозит из-за IO.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено анонимчик , 18-Апр-20 19:15 
> Подскажи тогда годноту, если ты такой эксперт

кликхаус


"Выпуск СУБД TimescaleDB 1.7"
Отправлено DeadMustdie , 19-Апр-20 20:47 
> кликхаус

Таки либо облако, либо ковыряй сам - поддержки не будет даже за деньги.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 18-Апр-20 10:57 
Скажите мне непросвещённому, чем оно лучше того же MySQL?

"Выпуск СУБД TimescaleDB 1.7"
Отправлено Catwoolfii , 18-Апр-20 13:24 
mysql не поддерживает time series?

"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 18-Апр-20 21:38 
А разве на СУБД без подобных расширений нельзя хранить выборки через заданные промежутки времени? А то разработчики всяких там АИИС КУЭ и не знают.

"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 19-Апр-20 02:23 
Можно, но mysql вряд ли сможет нормально работать с таблицей с триллионами записей на одном сервере, в то время как для специализированных БД для временных рядов - это детская нагрузка. https://github.com/VictoriaMetrics/VictoriaMetrics/wiki/Case...

"Выпуск СУБД TimescaleDB 1.7"
Отправлено нах. , 19-Апр-20 09:52 
осталось понять, являются ли сопли и клей поверх postgres "специализированной бд для временных рядов", и насколько быстро тот постгрез лопнет.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено DeadMustdie , 19-Апр-20 20:50 
> являются ли сопли и клей поверх postgres

В каких-то пределах являются.
Разумной альтернативой является разве что Informix с его Time Series, концептуально история аналогично.
И да, там только за деньги (не очень большие, правда), и ни разу не open source.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено нах. , 19-Апр-20 22:58 
это если хочется именно sql.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено Lex , 18-Апр-20 20:27 
Тем же, чем и блокчейн[ т.е ничем, но хомяки одобрят ]

"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 20-Апр-20 13:17 
> одобрят

Вы им не говорите, что данные менять нельзя, а то не одобрят.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено анонимчик , 18-Апр-20 12:39 
чем оно лучше кликхаус?

"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 18-Апр-20 15:19 
чем анонимчик отличается от дегенерата?

"Выпуск СУБД TimescaleDB 1.7"
Отправлено КО , 18-Апр-20 16:10 
Ничем, duh...
Аргументы пожалуйста

"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 18-Апр-20 16:14 
тем что тормознутее, ибо pq не колоночная DB.

"Выпуск СУБД TimescaleDB 1.7"
Отправлено DeadMustdie , 19-Апр-20 20:54 
> тем что тормознутее, ибо pq не колоночная DB.

В subj для хранения временных рядов используются специфические структуры данных.
Построчное хранение идентификационной информации по рядам не обязательно плохо влияет на производительность, там данных обычно на 3 копейки, особенно на фоне самих рядов.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 18-Апр-20 18:08 
А чем сабж лучше чем DB2?

"Выпуск СУБД TimescaleDB 1.7"
Отправлено DeadMustdie , 19-Апр-20 20:52 
> А чем сабж лучше чем DB2?

Не совсем сравнимо. Скорее аналог - Informix Time Series, который проработан существенно лучше, но реализует ту же самую идею.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 18-Апр-20 20:43 
В clickhouse нет транзакций например.

"Выпуск СУБД TimescaleDB 1.7"
Отправлено анонимчик , 18-Апр-20 21:41 
то плюс для таймсериес

"Выпуск СУБД TimescaleDB 1.7"
Отправлено DeadMustdie , 19-Апр-20 20:55 
> тем что тормознутее, ибо pq не колоночная DB.

А вот не факт.
Приложения разные бывают.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 20-Апр-20 10:56 
отсутствие транзакций никогда не является плюсом, это всегда компромис во имя чего-то другого

"Выпуск СУБД TimescaleDB 1.7"
Отправлено Аноним , 18-Апр-20 21:35 
Интересно, насколько хорошо timescaledb работает с триллионами строк? Victoriametrics нормально работает, судя по https://github.com/VictoriaMetrics/VictoriaMetrics/wiki/Case...

"Выпуск СУБД TimescaleDB 1.7"
Отправлено funny.falcon , 19-Апр-20 09:27 
Представьте себе: хранить нужно не только метртки.

"Выпуск СУБД TimescaleDB 1.7"
Отправлено anonymous , 19-Апр-20 18:21 
Если timeseries, то victoriametrics. Если OLAP, то ClickHouse.

"Выпуск СУБД TimescaleDB 1.7"
Отправлено DeadMustdie , 19-Апр-20 20:56 
> Если timeseries, то victoriametrics. Если OLAP, то ClickHouse.

Расскажите об этом коллегам из Teradata, Microsoft, IBM, Oracle, SAP и Vertica.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено DeadMustdie , 19-Апр-20 20:57 
В целом - жизнь немножко шире любых представлений о ней ;)

"Выпуск СУБД TimescaleDB 1.7"
Отправлено анонимуслинус , 19-Апр-20 16:44 
вот она база данных для научных вычислений и экспериментов. вопрос только в том выдержит она скажем записи данных с одронного коллайдера или других физических экспериментов с миллионами мелких датчиков?))

"Выпуск СУБД TimescaleDB 1.7"
Отправлено DeadMustdie , 19-Апр-20 21:02 
> вопрос только в том выдержит она скажем записи данных с одронного коллайдера или других физических экспериментов с миллионами мелких датчиков?))

Интересный вопрос.
Когда я последний раз интересовался (довольно давно), самая здоровая единая реляционная БД в мире как раз обслуживала вроде бы ЦЕРН-овский, если не путаю, ускоритель. И сделана она была на DB2 в горизонтально масштабируемой конфигурации (Database Partitioning Feature = DPF, если быть точным).

Но воды с тех пор немало утекло, так что рекордсмен наверное поменялся.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено Анончик , 20-Апр-20 06:01 
Наверное путаете, в цене судя по докаладам оракл во все поля за редким исключением.

"Выпуск СУБД TimescaleDB 1.7"
Отправлено DeadMustdie , 20-Апр-20 11:31 
> Наверное путаете, в цене судя по докаладам оракл во все поля за редким исключением.

Не путаю, у Оракла встроенный "шардинг" лишь относительно недавно появился, и до сих пор довольно кривенький.


"Выпуск СУБД TimescaleDB 1.7"
Отправлено qsdg , 21-Апр-20 17:39 
В коллайдере у них там несколько уровней предобработки данных перед записью, на каждом уровне по 99% данных выбрасываются за ненужностью. И только потом записываются. Иначе в мире дисков не хватит чтобы сырые данные с одного эксперимента записать.