资讯专栏INFORMATION COLUMN

2. Q语言学习之路—基本数据类型: Atoms

李涛 / 1237人阅读

摘要:概述所有的数据都是通过最小单位构造。语言中大部分数据类型与传统语言类似,但是多出了和相关的类型,用来加速时间序列运算。适用的运算符仅有数据中共有两种类型数据,更类似于中的和。其表示值为从千禧年计数的纳秒数,之前为负数,之后为正数。

概述

所有的数据都是通过最小单位atom构造。q语言中大部分数据类型与传统语言类似,但是多出了date和time相关的类型,用来加速时间序列运算。下表给出了q语言和几个传统语言数据类型的对比:


下表给出了Q语言各个类型的详细信息:


1. 整型数据

long: 8字节; 42, 42j

short: 2字节有符号数;其后必须带后缀h; eg: -123h

int: 4字节有符号数;其后必须带后缀i; eg: 1234567890i

2. 浮点数据

支持单精度双精度浮点数据类型。

float: 8字节;后缀f; 传统语言中的double; eg: 3.1415926, 1f, 1.0, 1.234e07, 1.234e-7

real: 4字节;后缀e; 传统语言中的float; eg: 12.34e, 1.234e7e
注:不建议使用real这个类型,因为在许多金融问题中,real的精度往往不够用

浮点数显示精度: q console默认显示7位小数,可以通过命令 P 来最多显示16位小数,也可以通过 P 0 来显示完整的17位小数,但是最后一位小数不可信。

</>复制代码

  1. q)f12:1.23456789012
  2. q)f16:1.234567890123456
  3. q)P 12
  4. q)f12
  5. 1.23456789012
  6. q)f16
  7. 1.23456789012
  8. q)P 16
  9. q)f12
  10. 1.23456789012
  11. q)f16
  12. 1.234567890123456
  13. q)P 0
  14. q)1%3
  15. 0.33333333333333331

3. Binary数据

boolean : 1字节; 后缀b; 没有true或者false关键字, 1b代表true, 0b代表false

byte : 使用1字节保存8位数据,前缀0x紧跟着2个16进制数,大小写均可。 eg: 0x2A, 0x2a

GUID : globally unique identifier. 在时间和空间上都唯一,可以对null guid值0Ng使用?来生成一个guids的列表。
eg: 1?0Ng, 2?0Ng, -2?0Ng
使用正号和负号生成guid列表的区别在于:正号使用同一个随机种子(seed), 而负号使用的种子是随机的

可以通过解析一个16进制数字来构造guid:"G"$"61f35174-90bc-a48a-d88f-e15e4a377ec8", 同样,可以使用命令sv来从一个16个byte的列表构造guid: 0x0 sv 16?0xff

GUID适用的运算符仅有:~, =, <, >, null

4. Text数据

q中共有两种text类型数据,更类似于SQL中的CHARVARCHAR

char : 1字节; 对应SQL中的CHAR; 用双引号表示;特殊字符用作为前缀来显示,尽管在q-console中依旧将显示了出来,但是实际上它就是一个单字符

</>复制代码

  1. q)""" / double-quote
  2. """
  3. q)"" / back-slash
  4. ""
  5. q)"
  6. " / newline
  7. "
  8. "
  9. q)"
  10. " / return
  11. "
  12. "
  13. q)"
  14. " / horizontal tab
  15. "
  16. "
  17. q)"142"
  18. "b"

symbol : 前缀` eg: q, `zaphod`
symbol与char一样,同样是原子数据,这意味着symbol不可拆分,symbol中的单个字符不可获取。 symbol不是string, 并且symbol数据`a与char数据"a"不相等。

5. 时间类型数据

date : 4字节,表示为yyyy.mm.dd; 其表示值为从2000.01.01开始的日期数,在之前的为负值,之后的为正值。

</>复制代码

  1. q)2000.01.01=0
  2. 1b

表示的累积日数可以通过强制转换得到:

</>复制代码

  1. q)`int$2000.02.01

Time :

如果毫秒级够用的话,使用time类型,表示为hh:mm:ss.uuu;其表示值为从00:00的毫秒(milliseconds)数

</>复制代码

  1. q)12:34:56.789
  2. 12:34:56.789
  3. q)12:00:00.000=12*60*60*1000
  4. 1b

其表示值同样可以通过强制转换来获取

如果毫秒级不够用的话,使用timespan类型;其表示为从00:00开始的纳秒(nanoseconds)数, 表示为0Dhh:mm:ss.nnnnnnnnn。 其中0D是可选的。

</>复制代码

  1. q)12:34:56.123456789
  2. 0D12:34:56.123456789
  3. q)12:34:56.123456 / microseconds become nanos
  4. 0D12:34:56.123456000

Date-Time :
(已弃用的) 使用T进行分隔:

</>复制代码

  1. q)2000.01.01T12:00:00.000
  2. _
  3. q)2000.01.02T12:00:00.000=1.5
  4. 1b

可以通过q)date$2000.01.02T12:00:00.000`来提取日期和时间

更推荐使用的类型是timestamp, 是date类型和timespan类型的连接,通过D进行分离。其表示值为从千禧年计数的纳秒数,之前为负数,之后为正数。
同样,有如下的操作:

</>复制代码

  1. q)2014.11.22D17:43:40.123456789
  2. q)`long$2014.11.22D17:43:40.123456789
  3. q)`date$2014.11.22D17:43:40.123456789
  4. q)`timespan$2014.11.22D17:43:40.123456789

month : 32位带符号整型, 表示为yyyy.mm和一个尾符号m, 其表示值为从千禧年计数的月份数。注意不要忘记带尾缀m

</>复制代码

  1. q)2015.11m
  2. q)2001.01m=12
  3. 1b

minute : 32位带符号整型, 表示为hh:mm, 其表示值为从00:00计数的分钟数。

</>复制代码

  1. q)12:30
  2. q)12:00=12*60
  3. 1b

second : 32位带符号整型, 表示为hh:mm:ss, 其表示值为从00:00计数的秒数。

</>复制代码

  1. q)23:59:59
  2. q)23:59:59=-1+24*60*60
  3. 1b

构成和点操作符 :
可以通过点操作符提取日期,月份,日等

</>复制代码

  1. q)dt:2014.01.01
  2. q)dt.year
  3. 2014i
  4. q)dt.mm
  5. q)dt.dd
  6. q)ti:12:34:56.789
  7. q)ti.hh
  8. 12i
  9. q)ti.mm
  10. q)ti.ss

但是更推荐使用强制转换符,因为它对所有有意义的时间提取和转换都是有效的:

</>复制代码

  1. q)`dd$dt
  2. 1i
  3. q)`mm$dt
  4. q)`dd$dt
  5. q)`month$dt
  6. 2014.01m

6. 算术Infinities 和 Nulls

一些特殊含义的表示:

</>复制代码

  1. Literal Value
  2. 0w Positive float infinity
  3. -0w Negative float infinity
  4. 0n Null float ; NaN, or not a number
  5. 0W Positive long infinity
  6. -0W Negative long infinity
  7. 0N Null long

注意小写的w代表float, 大写的W代表整数。

在q语言中,数字的除法结果总是float. 正数除以0的结果为正无穷,负数除以0的结果为负无穷。 在数学中,0除以0是未定义的,因此,0n代表NaN。整型无穷可以参与比较并返回正确的结果

</>复制代码

  1. q)42<0W
  2. 1b
  3. q)-0W<42
  4. 1b

无穷代表实际的值:

</>复制代码

  1. q C Equivalent Numeric
  2. 0N MIN_INT -9223372036854775808
  3. -0W MIN_INT+1 -9223372036854775807
  4. 0W MAX_INT +9223372036854775807

因此,整型的大小顺序为:

</>复制代码

  1. 0N < -0W < normal integer < 0W
  2. q)9223372036854775806+1
  3. 0W
  4. q)-0W-1
  5. 0N
  6. q)-0W+1
  7. -9223372036854775806

实际上q语言没有溢出解释了如下现象:

</>复制代码

  1. q)0W+1
  2. 0N
  3. q)0W+2
  4. -0W
  5. q)0W+3
  6. -9223372036854775806
7. Nulls

null值一般表示的是缺失数据。在q中, null与正常的值占用同样的空间,如下总结了null的不同类型值:

</>复制代码

  1. type null
  2. boolean 0b
  3. guid 0Ng (00000000-0000-0000-0000-000000000000)
  4. byte 0x00
  5. short 0Nh
  6. Int 0N
  7. long 0Nj
  8. real 0Ne
  9. float 0n
  10. char " "
  11. sym `
  12. timestamp 0Np
  13. month 0Nm
  14. date 0Nd
  15. datetime 0Nz
  16. timespan 0Nn
  17. minute 0Nu
  18. second 0Nv
  19. time 0Nt

注意:""不是一个null char, 而是一个char的空列表

使用null指令而不是=来测试一个值是不是null值,因为q语言是动态类型的,而null指令是类型独立的。

</>复制代码

  1. q)null 42
  2. 0b
  3. q)null `
  4. 1b
  5. q)null " "
  6. 1b
  7. q)null ""

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/17962.html

相关文章

  • 7. Q语言学习之路数据转换

    摘要:可以通过命令来查看全局变量和对应的值,也可以通过操作符来查看转换使用操作符,右边的运算元是原始值,而左边的运算元是目标类型。从中解析数据使用大写的目标类型作为左运算元,作为右运算元。 1. 类型 1. 基础数据类型 showImg(https://segmentfault.com/img/bVbqZmF?w=503&h=599); showImg(https://segmentfaul...

    antz 评论0 收藏0

发表评论

0条评论

李涛

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<