influxdb快速入门指南

InfluxDB安装完成之后,我们开始来做一些有意思的事。在这一章里面我们将会用到influx这个命令行工具,这个工具包含在InfluxDB的安装包里,是一个操作数据库的轻量级工具。它直接通过InfluxDB的HTTP接口(如果没有修改,默认是8086)来和InfluxDB通信。

说明:也可以直接发送裸的HTTP请求来操作数据库,例如curl,我们后面在介绍rest这种接口。


InfluxDB创建数据库

如果你已经在本地安装运行了InfluxDB,你就可以直接使用influx命令行,执行influx连接到本地的InfluxDB实例上。输出就像下面这样:

influx

influxdb-shell

说明:
- InfluxDB的HTTP接口默认起在8086上,所以influx默认也是连的本地的8086端口,你可以通过influx --help来看怎么修改默认值。 - -precision参数表明了任何返回的时间戳的格式和精度,在上面的例子里,rfc3339是让InfluxDB返回RFC339格式(YYYY-MM-DDTHH:MM:SS.nnnnnnnnnZ)的时间戳。

这样这个命令行已经准备好接收influx的查询语句了(简称InfluxQL),用exit可以退出命令行。

第一次安装好InfluxDB之后是没有数据库的(除了系统自带的_internal),因此创建一个数据库是我们首先要做的事,通过CREATE DATABASE <db-name>这样的InfluxQL语句来创建,其中<db-name>就是数据库的名字。数据库的名字可以是被双引号引起来的任意Unicode字符。如果名称只包含ASCII字母,数字或下划线,并且不以数字开头,那么也可以不用引起来。


创建一个mydb数据库

我们来创建一个mydb数据库:

CREATE DATABASE mydb

说明:在输入上面的语句之后,并没有看到任何信息,这在CLI里,表示语句被执行并且没有错误,如果有错误信息展示,那一定是哪里出问题了,这就是所谓的没有消息就是好消息。这一点很多人都不习惯,因为在mysql中,会有反馈,influxdb没有反馈,让人觉得不知道发生了什么。

influxdb-create-db

现在数据库mydb已经创建好了,我们可以用SHOW DATABASES语句来看看已存在的数据库,也可以用小写的show databases:

> SHOW DATABASES
name: databases
---------------
name
_internal
mydb

说明:_internal数据库是用来存储InfluxDB内部的实时监控数据的。

不像SHOW DATABASES,大部分InfluxQL需要作用在一个特定的数据库上。你当然可以在每一个查询语句上带上你想查的数据库的名字,但是CLI提供了一个更为方便的方式USE <db-name>,这会为你后面的所以的请求设置到这个数据库上。例如:

> USE mydb
Using database mydb
>

以下的操作都作用于mydb这个数据库之上。


Influxdb写数据

现在我们已经有了一个数据库,那么InfluxDB就可以开始接收读写了。

首先对数据存储的格式来个入门介绍。InfluxDB里存储的数据被称为时间序列数据,其包含一个数值,就像CPU的load值或是温度值类似的。时序数据有零个或多个数据点,每一个都是一个指标值。数据点包括time(一个时间戳),measurement(例如cpu_load),至少一个k-v格式的field(也即指标的数值例如 “value=0.64”或者“temperature=21.2”),零个或多个tag,其一般是对于这个指标值的元数据(例如“host=server01”, “region=EMEA”, “dc=Frankfurt)。

在概念上,你可以将measurement类比于SQL里面的table,其主键索引总是时间戳。tagfield是在table里的其他列,tag是被索引起来的,field没有。不同之处在于,在InfluxDB里,你可以有几百万的measurements,你不用事先定义数据的scheme(模式),并且null值不会被存储。

将数据点写入InfluxDB,只需要遵守如下的行协议:

insert <measurement>[,<tag-key>=<tag-value>...] <field-key>=<field-value>[,<field2-key>=<field2-value>...] [unix-nano-timestamp]

中扩号中的内容,是可选的,可以有,有可以没有。

上面说了measurement类似表名,那么上面的语义就是: 向某个表插入一些数据。

下面是数据写入InfluxDB的格式示例:

insert cpu,host=serverA,region=us_west value=0.64
payment,device=mobile,product=Notepad,method=credit billed=33,licenses=3i 1434067467100293230

cpu是表的意思,其他几个等号连接起来的是键值对,最后一个是时间戳。

举个例子:

使用命令行插入单条的时间序列数据到InfluxDB中,用INSERT后跟数据点:

INSERT cpu,host=serverA,region=us_west value=0.64

这样一个measurement为cpu,tag是hostregionvalue值为0.64的数据点被写入了InfluxDB中。注意没有写时间,表示默认时间。


Influxdb查询数据

现在我们查出写入的这笔数据:

use mydb
SELECT "host", "region", "value" FROM "cpu"

执行结果如下:

Influxdb查询数据

说明:我们在写入的时候没有包含时间戳,当没有带时间戳的时候,InfluxDB会自动添加本地的当前时间作为它的时间戳。

让我们来写入另一笔数据,它包含有两个字段:

INSERT temperature,machine=unit42,type=assembly external=25,internal=37

查询的时候想要返回所有的字段和tag,可以用*,和mysql的语法基本一致。


> SELECT * FROM "temperature" name: temperature ----------------- time external internal machine type 2015-10-21T19:28:08.385013942Z 25 37 unit42 assembly

InfluxQL还有很多特性和用法没有被提及,包括支持golang样式的正则,例如:

SELECT * FROM /.*/ LIMIT 1

这表示查出所有表中的一条数据,如下:

influxdb-正则表达式查询


小结

本章只是开始,有更多的关于Influxdb的读写的操作,请继续关注后面的文章。