├── .gitignore ├── Dockerfile ├── EXELOG.md ├── README.md ├── code ├── calc_acc.py ├── check_input_feature.py ├── config.py ├── dbengine.py ├── hand_set.py ├── new_mark_acc_ensure.py ├── nl2sql_main.py ├── post_treat.py ├── question_prepro.py ├── start_test.sh ├── start_train.sh └── utils.py ├── data ├── chinese-bert_chinese_wwm_L-12_H-768_A-12 │ └── vocab.txt ├── logs │ ├── where_cnt_error.log │ ├── where_col_error.log │ ├── where_oper_error.log │ └── where_val_error.log └── prepare_data │ ├── col_in_text │ ├── new_q_correct │ ├── new_q_exactly_match │ ├── new_q_exactly_more_strict_match │ ├── new_q_need_col_sim │ ├── new_q_no_num_similar │ ├── new_q_one_vs_more_col │ └── new_q_text_contain_similar ├── img └── nl2sql_model_old.png ├── requirements └── run.sh /.gitignore: -------------------------------------------------------------------------------- 1 | /input/* 2 | *.txt 3 | .idea/* 4 | *.csv 5 | *.zip 6 | *.pack 7 | *.json 8 | *.pyc 9 | ./tianchi/nl2sql_baseline/saved_model/best_model/* 10 | ./tianchi/nl2sql_baseline/data/char_embedding 11 | .vscode 12 | *.pdf 13 | *.weights 14 | *.json 15 | *.db 16 | bert_model.* 17 | vocab.txt -------------------------------------------------------------------------------- /Dockerfile: -------------------------------------------------------------------------------- 1 | # Base Images 2 | FROM registry.cn-shanghai.aliyuncs.com/tcc-public/tensorflow:latest-cuda10.0-py3-ys-base 3 | ADD . /competition 4 | WORKDIR /competition 5 | # CMD ["sh", "run.sh"] -------------------------------------------------------------------------------- /EXELOG.md: -------------------------------------------------------------------------------- 1 | ``` 2 | Epoch 1/40 3 | Building prefix dict from the default dictionary ... 4 | Loading model from cache /tmp/jieba.cache 5 | Loading model cost 0.649 seconds. 6 | Prefix dict has been built succesfully. 7 | 2019-10-01 10:31:42.085218: I tensorflow/stream_executor/dso_loader.cc:152] successfully opened CUDA library libcublas.so.10.0 locally 8 | 1298/1298 [==============================] - 763s 588ms/step - loss: 3.7022 9 | 4394it [00:50, 93.79it/s]Sel-Num: 1.000, Sel-Col: 1.000, Sel-Agg: 1.000, W-Num: 0.154, W-Col: 0.231, W-Op: 0.072, W-Val: 0.369, W-Rel: 0.108, total_err: 1.000 10 | Acc in evaluate data set is 0.0 11 | 4396it [00:52, 84.03it/s] 12 | acc: 0.00000, best acc: 0.00000 13 | 14 | Epoch 2/40 15 | 1298/1298 [==============================] - 742s 572ms/step - loss: 1.3105 16 | 4392it [00:48, 97.26it/s]Sel-Num: 0.205, Sel-Col: 0.242, Sel-Agg: 0.230, W-Num: 0.075, W-Col: 0.103, W-Op: 0.025, W-Val: 0.182, W-Rel: 0.049, total_err: 0.390 17 | Acc in evaluate data set is 0.6098726114649682 18 | 4396it [00:50, 87.89it/s] 19 | acc: 0.60987, best acc: 0.60987 20 | 21 | Epoch 3/40 22 | 1298/1298 [==============================] - 736s 567ms/step - loss: 0.4766 23 | 4392it [00:47, 89.31it/s]Sel-Num: 0.118, Sel-Col: 0.143, Sel-Agg: 0.138, W-Num: 0.057, W-Col: 0.090, W-Op: 0.015, W-Val: 0.151, W-Rel: 0.036, total_err: 0.288 24 | Acc in evaluate data set is 0.7120109190172885 25 | 4396it [00:49, 88.91it/s] 26 | acc: 0.71201, best acc: 0.71201 27 | 28 | Epoch 4/40 29 | 1298/1298 [==============================] - 732s 564ms/step - loss: 0.3215 30 | 4395it [00:48, 74.27it/s]Sel-Num: 0.084, Sel-Col: 0.107, Sel-Agg: 0.101, W-Num: 0.058, W-Col: 0.079, W-Op: 0.017, W-Val: 0.131, W-Rel: 0.038, total_err: 0.252 31 | Acc in evaluate data set is 0.7484076433121019 32 | 4396it [00:50, 87.69it/s] 33 | acc: 0.74841, best acc: 0.74841 34 | 35 | Epoch 5/40 36 | 1298/1298 [==============================] - 737s 567ms/step - loss: 0.2382 37 | 4390it [00:47, 83.63it/s]Sel-Num: 0.069, Sel-Col: 0.096, Sel-Agg: 0.086, W-Num: 0.056, W-Col: 0.075, W-Op: 0.016, W-Val: 0.123, W-Rel: 0.039, total_err: 0.236 38 | Acc in evaluate data set is 0.7641037306642402 39 | 4396it [00:49, 89.23it/s] 40 | acc: 0.76410, best acc: 0.76410 41 | 42 | Epoch 6/40 43 | 1298/1298 [==============================] - 737s 568ms/step - loss: 0.1908 44 | 4390it [00:50, 84.82it/s]Sel-Num: 0.063, Sel-Col: 0.088, Sel-Agg: 0.078, W-Num: 0.055, W-Col: 0.084, W-Op: 0.017, W-Val: 0.128, W-Rel: 0.038, total_err: 0.235 45 | Acc in evaluate data set is 0.7647861692447679 46 | 4396it [00:51, 84.87it/s] 47 | acc: 0.76479, best acc: 0.76479 48 | 49 | Epoch 7/40 50 | 1298/1298 [==============================] - 763s 588ms/step - loss: 0.1599 51 | 4395it [00:48, 97.55it/s]Sel-Num: 0.056, Sel-Col: 0.078, Sel-Agg: 0.071, W-Num: 0.049, W-Col: 0.066, W-Op: 0.015, W-Val: 0.116, W-Rel: 0.034, total_err: 0.208 52 | Acc in evaluate data set is 0.7916287534121929 53 | 4396it [00:50, 87.70it/s] 54 | acc: 0.79163, best acc: 0.79163 55 | 56 | Epoch 8/40 57 | 1298/1298 [==============================] - 726s 559ms/step - loss: 0.1280 58 | 4396it [00:48, 87.86it/s]Sel-Num: 0.055, Sel-Col: 0.077, Sel-Agg: 0.069, W-Num: 0.051, W-Col: 0.066, W-Op: 0.015, W-Val: 0.114, W-Rel: 0.035, total_err: 0.208 59 | Acc in evaluate data set is 0.7923111919927206 60 | 61 | acc: 0.79231, best acc: 0.79231 62 | 63 | Epoch 9/40 64 | 1298/1298 [==============================] - 722s 556ms/step - loss: 0.1130 65 | 4394it [00:48, 91.69it/s]Sel-Num: 0.044, Sel-Col: 0.067, Sel-Agg: 0.057, W-Num: 0.043, W-Col: 0.066, W-Op: 0.014, W-Val: 0.111, W-Rel: 0.029, total_err: 0.192 66 | Acc in evaluate data set is 0.8075523202911739 67 | 4396it [00:50, 87.65it/s] 68 | acc: 0.80755, best acc: 0.80755 69 | 70 | Epoch 10/40 71 | 1298/1298 [==============================] - 708s 546ms/step - loss: 0.0929 72 | 4393it [00:48, 89.92it/s]Sel-Num: 0.044, Sel-Col: 0.068, Sel-Agg: 0.057, W-Num: 0.049, W-Col: 0.068, W-Op: 0.015, W-Val: 0.114, W-Rel: 0.033, total_err: 0.200 73 | Acc in evaluate data set is 0.8002729754322111 74 | 4396it [00:50, 87.37it/s] 75 | acc: 0.80027, best acc: 0.80755 76 | 77 | Epoch 11/40 78 | 1298/1298 [==============================] - 709s 547ms/step - loss: 0.0836 79 | 4392it [00:47, 76.12it/s]Sel-Num: 0.040, Sel-Col: 0.065, Sel-Agg: 0.056, W-Num: 0.046, W-Col: 0.064, W-Op: 0.014, W-Val: 0.106, W-Rel: 0.032, total_err: 0.189 80 | Acc in evaluate data set is 0.8105095541401274 81 | 4396it [00:49, 89.48it/s] 82 | acc: 0.81051, best acc: 0.81051 83 | 84 | Epoch 12/40 85 | 1298/1298 [==============================] - 712s 548ms/step - loss: 0.0689 86 | 4393it [00:48, 85.06it/s]Sel-Num: 0.042, Sel-Col: 0.065, Sel-Agg: 0.054, W-Num: 0.047, W-Col: 0.059, W-Op: 0.014, W-Val: 0.103, W-Rel: 0.032, total_err: 0.186 87 | Acc in evaluate data set is 0.8136942675159236 88 | 4396it [00:49, 88.46it/s] 89 | acc: 0.81369, best acc: 0.81369 90 | 91 | Epoch 13/40 92 | 1298/1298 [==============================] - 710s 547ms/step - loss: 0.0664 93 | 4389it [00:48, 91.98it/s]Sel-Num: 0.040, Sel-Col: 0.065, Sel-Agg: 0.055, W-Num: 0.047, W-Col: 0.062, W-Op: 0.014, W-Val: 0.106, W-Rel: 0.033, total_err: 0.189 94 | Acc in evaluate data set is 0.8105095541401274 95 | 4396it [00:49, 88.47it/s] 96 | acc: 0.81051, best acc: 0.81369 97 | 98 | Epoch 14/40 99 | 1298/1298 [==============================] - 711s 547ms/step - loss: 0.0633 100 | 4395it [00:48, 86.96it/s]Sel-Num: 0.040, Sel-Col: 0.064, Sel-Agg: 0.052, W-Num: 0.048, W-Col: 0.063, W-Op: 0.014, W-Val: 0.103, W-Rel: 0.033, total_err: 0.190 101 | Acc in evaluate data set is 0.8100545950864422 102 | 4396it [00:49, 89.02it/s] 103 | acc: 0.81005, best acc: 0.81369 104 | 105 | Epoch 15/40 106 | 1298/1298 [==============================] - 710s 547ms/step - loss: 0.0530 107 | 4390it [00:48, 84.94it/s]Sel-Num: 0.033, Sel-Col: 0.059, Sel-Agg: 0.048, W-Num: 0.048, W-Col: 0.063, W-Op: 0.015, W-Val: 0.105, W-Rel: 0.033, total_err: 0.188 108 | Acc in evaluate data set is 0.8116469517743403 109 | 4396it [00:49, 88.48it/s] 110 | acc: 0.81165, best acc: 0.81369 111 | 112 | Epoch 16/40 113 | 1298/1298 [==============================] - 709s 546ms/step - loss: 0.0431 114 | 4389it [00:49, 93.83it/s]Sel-Num: 0.040, Sel-Col: 0.062, Sel-Agg: 0.054, W-Num: 0.046, W-Col: 0.059, W-Op: 0.015, W-Val: 0.101, W-Rel: 0.031, total_err: 0.185 115 | Acc in evaluate data set is 0.815059144676979 116 | 4396it [00:50, 87.05it/s] 117 | acc: 0.81506, best acc: 0.81506 118 | 119 | Epoch 17/40 120 | 1298/1298 [==============================] - 710s 547ms/step - loss: 0.0417 121 | 4391it [00:48, 95.01it/s]Sel-Num: 0.038, Sel-Col: 0.064, Sel-Agg: 0.051, W-Num: 0.048, W-Col: 0.070, W-Op: 0.014, W-Val: 0.106, W-Rel: 0.033, total_err: 0.196 122 | Acc in evaluate data set is 0.8036851683348498 123 | 4396it [00:49, 88.71it/s] 124 | acc: 0.80369, best acc: 0.81506 125 | 126 | Epoch 18/40 127 | 1298/1298 [==============================] - 711s 548ms/step - loss: 0.0409 128 | 4392it [00:49, 95.83it/s]Sel-Num: 0.034, Sel-Col: 0.060, Sel-Agg: 0.048, W-Num: 0.044, W-Col: 0.061, W-Op: 0.016, W-Val: 0.101, W-Rel: 0.030, total_err: 0.184 129 | Acc in evaluate data set is 0.8164240218380345 130 | 4396it [00:50, 87.10it/s] 131 | acc: 0.81642, best acc: 0.81642 132 | 133 | Epoch 19/40 134 | 1298/1298 [==============================] - 710s 547ms/step - loss: 0.0352 135 | 4391it [00:48, 96.58it/s]Sel-Num: 0.035, Sel-Col: 0.061, Sel-Agg: 0.048, W-Num: 0.044, W-Col: 0.056, W-Op: 0.014, W-Val: 0.098, W-Rel: 0.032, total_err: 0.179 136 | Acc in evaluate data set is 0.8205186533212011 137 | 4396it [00:49, 88.12it/s] 138 | acc: 0.82052, best acc: 0.82052 139 | 140 | Epoch 20/40 141 | 1298/1298 [==============================] - 709s 546ms/step - loss: 0.0308 142 | 2205it [00:25, 82.22it/s]Traceback (most recent call last): 143 | 144 | ...... 145 | 未完待续 146 | ``` 147 | 148 | -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | 2 | ## Part0: 参赛成绩 3 | - 平台昵称: yscoder 4 | - 参赛形式: 个人 5 | - 复赛排名: 15 6 | 7 | ## Part1: 代码环境 8 | --- 9 | ### 环境配置步骤如下: 10 | 11 | --- 12 | #### 1. 深度学习相关环境 13 | 14 | 配置详情 15 | - 显卡: 1080ti 16 | - OS: Ubuntu 17 | - Driver Version: 418.56 18 | - CUDA Version: 10.1 19 | - cudnn version 20 | 21 | --- 22 | #### 2. Python相关环境 23 | 24 | ``` shell 25 | conda create --name nl2sql-yscoder1 python=3.6 26 | source activate 27 | conda activate nl2sql-yscoder1 28 | pip install --upgrade pip 29 | pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements 30 | ``` 31 | root@481c7f8087a2 32 | 33 | 执行训练任务(训练入口): 34 | ``` 35 | cd code 36 | sh start_train.sh 37 | ``` 38 | 执行推理任务(推理入口): 39 | ``` 40 | cd code 41 | sh start_test.sh 42 | ``` 43 | 44 | #### 3. 模型与训练文件信息 45 | - Bert中文预训练模型(哈工大版) ,该模型存储位置: ./submit/chinese-bert_chinese_wwm_L-12_H-768_A-12 [下载地址](https://github.com/ymcui/Chinese-BERT-wwm) 46 | 47 | - Bert-finetune模型,该模型为经过finetune之后的,适配于当前nl2sql任务的训练模型, 该模型存储路径 ./data/weights/nl2sql_finetune.weights 48 | 训练好的模型链接: https://pan.baidu.com/s/11tQVSZl9e6VBLPp85c9JRQ 提取码: 4ceg 49 | 50 | - 数据集位置 51 | 52 | 53 | 54 | ## Part2: 预处理 55 | --- 56 | ### 一. 数值类型转化 57 | 58 |  官方提供的数据集中考虑到用户输入的多样性,所以question包含了各种展现形式的数值类型.模型处理时首先对question进行了格式统一,具体如下: 59 | 1. 百分数转换,例如**百分之10**转化为**10%**,**百分之十**转换为**10%**, 百分之一点五转化为**1.5%** 60 | 61 | 2. 大写数字转阿拉伯数字,例如**十二**转换为**12**; **二十万**转化为**200000**; 一点二转化为**1.2** 62 | 3. 年份转换,如将12年转换为2012年 63 | 64 | 数值类型转换过程当中用到了大量正则匹配,主要匹配出数字可能出现的位置,以利于后续对**训练集**做标记. 65 | 具体代码位置: **question_prepro.py** 66 | 功能汇总函数: **trans_question_acc** 67 | 68 | 69 | --- 70 | ### 二. 训练集数据清洗与分类 71 | 72 | 具体代码文件: new_mark_acc_ensure.py check_input_feature.py 73 | 74 | --- 75 | 76 | ## Part3:模型介绍 77 | Todo (这两天把图做好 ) 78 | 79 | 80 | [部分训练日志](https://github.com/yscoder-github/nl2sql-tianchi/blob/master/EXELOG.md) 81 | > 注意,如果执行此代码报错,需要修改一下Keras的backend/tensorflow_backend.py,将sparse_categorical_crossentropy函数中原本是 82 | 83 | ``` python 84 | logits = tf.reshape(output, [-1, int(output_shape[-1])]) 85 | ``` 86 | 的那一行改为 87 | ``` python 88 | logits = tf.reshape(output, [-1, tf.shape(output)[-1]]) 89 | ``` 90 | 91 | 92 | 模型解决的特殊问题: 93 | - AB型问题 94 | 例如:初一欢乐寒假这本书多少钱。 这个句子当中的初一与欢乐寒假是相邻的两个不同列的候选值 95 | - 一个候选值对应多列, 例如 eps2011与eps2012均大于10的股票有哪些? 这里的10对应了表中的两个列 96 | 97 | 98 | 99 | 100 | 101 | --- 102 | ## Part4: 后处理 103 | 后处理主要包括如下几块: 104 | 1. 数字中的部分**数位缺失**,例如**200000** 模型之预测到**200**,根据数字的性质,可以对缺失的数位做补齐处理 105 | 2. question中数值单位和表中单位进行统一. 例如question当中票房的单位是"亿",而在相关表中该列的单位为"百万". 本数据集中数值相关的单位存储在表的列名称或者表的title中. 106 | 107 | 代码文件: post_treat.py 108 | 109 | 110 | --- 111 | 112 | ## Part5: 模型效果评估 113 | 模型效果评估部分,主要采用官方baseline中的方法,并进行了一定封装.主要用于对预测各个部件的准确性进行评估,并存储预测的错误结果以用于后续分析. 114 | 功能所在文件为calc_acc.py 115 | 主要函数为check_part_acc 116 | 117 | --- 118 | ## Part6: TODO 119 | ### 数字通用前后缀挖掘 120 | 由于时间关系,原有方案在将文本中的"中文数字"转换为阿拉伯数字时, 用了一种1字前缀+1字后缀的方式来匹配"中文数字" ,例如: 121 | ``` 122 | '概天','到月', '于元', '在年', '于平', '足平', '过股', '过套', '招位', '前', '前中', '前名', '前个', '于的' 123 | ``` 124 | 上面的这几种**词对**也是通过对数据集进行处理而得出的。表面上看,虽然上面的几种**词对**可以将一些数字匹配出来,但是这种1字前缀+1字后缀的方式会将一些**专有名词**中的**中文数字**进行误换. 所以后期需要做**数字通用前后缀挖掘**,即挖掘出更好的**n字前缀+n字后缀** 125 | 126 | 127 | > 有兴趣的可以看看是否可以将所有的数值相关的训练材料从**阿拉伯数字**转换为**中文数字**,最后评估下模型效果 128 | 129 | 130 | ### 同义词解决方案 131 | 例如如何将问题中的鹅场和腾讯关联起来 132 | 133 | 134 | 135 | ### BUGFIX: (FIXED) 136 | ``` 137 | File "nl2sql_main.py", line 816, in 138 | callbacks=[evaluator] 139 | File "/home/yinshuai/anaconda3/envs/nl2sql-yscoder/lib/python3.6/site-packages/keras/legacy/interfaces.py", line 91, in wrapper 140 | return func(*args, **kwargs) 141 | File "/home/yinshuai/anaconda3/envs/nl2sql-yscoder/lib/python3.6/site-packages/keras/engine/training.py", line 1418, in fit_generator 142 | initial_epoch=initial_epoch) 143 | File "/home/yinshuai/anaconda3/envs/nl2sql-yscoder/lib/python3.6/site-packages/keras/engine/training_generator.py", line 251, in fit_generator 144 | callbacks.on_epoch_end(epoch, epoch_logs) 145 | File "/home/yinshuai/anaconda3/envs/nl2sql-yscoder/lib/python3.6/site-packages/keras/callbacks.py", line 79, in on_epoch_end 146 | callback.on_epoch_end(epoch, logs) 147 | File "nl2sql_main.py", line 798, in on_epoch_end 148 | acc = self.evaluate() 149 | File "nl2sql_main.py", line 806, in evaluate 150 | return evaluate(valid_data, valid_tables) 151 | File "nl2sql_main.py", line 721, in evaluate 152 | R = nl2sql(question, table) # 153 | File "nl2sql_main.py", line 555, in nl2sql 154 | if entity_start_pos_list[0] != v_start: 155 | IndexError: list index out of range 156 | 2209it [00:25, 86.28it/s] 157 | ``` 158 | 159 | ### 部分冗余逻辑重写 160 | 161 | 162 | ## 附录:代码树 163 | ``` 164 | ├── code 165 | │ ├── calc_acc.py 166 | │ ├── check_input_feature.py 167 | │ ├── config.py 168 | │ ├── dbengine.py 169 | │ ├── hand_set.py 170 | │ ├── new_mark_acc_ensure.py 171 | │ ├── nl2sql_main.py 172 | │ ├── post_treat.py 173 | │ ├── question_prepro.py 174 | │ ├── start_test.sh 175 | │ ├── start_train.sh 176 | │ └── utils.py 177 | ├── data 178 | │ ├── chinese-bert_chinese_wwm_L-12_H-768_A-12 179 | │ │ ├── bert_config.json 180 | │ │ ├── bert_model.ckpt.data-00000-of-00001 181 | │ │ ├── bert_model.ckpt.index 182 | │ │ ├── bert_model.ckpt.meta 183 | │ │ └── vocab.txt 184 | │ ├── logs 185 | │ │ ├── evaluate_pred.json 186 | │ │ ├── where_cnt_error.log 187 | │ │ ├── where_col_error.log 188 | │ │ ├── where_oper_error.log 189 | │ │ └── where_val_error.log 190 | │ ├── prepare_data 191 | │ │ ├── col_in_text 192 | │ │ ├── new_q_correct 193 | │ │ ├── new_q_exactly_match 194 | │ │ ├── new_q_exactly_more_strict_match 195 | │ │ ├── new_q_need_col_sim 196 | │ │ ├── new_q_no_num_similar 197 | │ │ ├── new_q_one_vs_more_col 198 | │ │ └── new_q_text_contain_similar 199 | │ ├── train 200 | │ │ ├── train.db 201 | │ │ ├── train.json 202 | │ │ └── train.tables.json 203 | │ ├── val.db 204 | │ ├── valid 205 | │ │ ├── val.db 206 | │ │ ├── val.json 207 | │ │ └── val.tables.json 208 | │ └── weights 209 | │ └── nl2sql_finetune.weights 210 | ├── Dockerfile 211 | ├── requirements 212 | ├── img 213 | │ └── nl2sql_model_old.png 214 | ├── README.md 215 | └── run.sh 216 | ``` 217 | 218 | 219 | -------------------------------------------------------------------------------- /code/calc_acc.py: -------------------------------------------------------------------------------- 1 | #coding=utf-8 2 | import sys 3 | from dbengine import DBEngine 4 | import numpy as np 5 | import os 6 | import json 7 | from config import * 8 | 9 | 10 | class Sqlite3Oper(): 11 | def __init__(self, engine): 12 | self.engine = engine 13 | 14 | def is_same_execute(self, tid, sql_gt, sql_pred): 15 | """ 16 | sql_gt & sql_pred is a dict and must contain sel, agg, conds, cond_conn_op 17 | """ 18 | ret_gt = self.engine.execute(tid, sql_gt['sel'], sql_gt['agg'], sql_gt['conds'], sql_gt['cond_conn_op']) 19 | try: 20 | ret_pred = self.engine.execute(tid, sql_pred['sel'], sql_pred['agg'], sql_pred['conds'], sql_pred['cond_conn_op']) 21 | except Exception as e: 22 | return False 23 | return ret_gt == ret_pred 24 | 25 | 26 | engine = DBEngine(os.path.join(valid_data_path, 'val.db')) 27 | sqlite_oper = Sqlite3Oper(engine) 28 | 29 | def check_part_acc(pred_queries, gt_queries, tables_list, valid_data): 30 | """ 31 | 判断各个组件的精确度 32 | param: 33 | pred_queries: array of query 34 | gt_queries: array of query 35 | tables_list: 表列表 36 | valid_data: valid data 带有数据比较多 37 | ouput: xxx 38 | 39 | """ 40 | NEED_REWRITE_LOG = True 41 | if NEED_REWRITE_LOG: 42 | fh_where_val_err = open(os.path.join(log_path, 'where_val_error.log'), 'w') 43 | fh_where_oper_err = open(os.path.join(log_path, 'where_oper_error.log'), 'w') 44 | fh_where_col_err = open(os.path.join(log_path, 'where_col_error.log'), 'w') 45 | fh_where_cnt_err = open(os.path.join(log_path, 'where_cnt_error.log'), 'w') 46 | 47 | tot_err = sel_num_err = agg_err = sel_err = 0.0 48 | cond_num_err = cond_col_err = cond_op_err = cond_val_err = cond_rela_err = 0.0 49 | 50 | 51 | for pred_qry, gt_qry, table_id, valid_d in zip(pred_queries, gt_queries, tables_list, valid_data): 52 | 53 | 54 | res = sqlite_oper.is_same_execute(table_id, gt_qry, pred_qry) 55 | # print(res) 56 | if res == True: 57 | continue 58 | # else: 59 | # print("exe is not good") 60 | good = True 61 | sel_pred, agg_pred, where_rela_pred = pred_qry['sel'], pred_qry['agg'], pred_qry['cond_conn_op'] 62 | sel_gt, agg_gt, where_rela_gt = gt_qry['sel'], gt_qry['agg'], gt_qry['cond_conn_op'] 63 | 64 | if where_rela_gt != where_rela_pred: 65 | good = False 66 | cond_rela_err += 1 67 | 68 | if len(sel_pred) != len(sel_gt): 69 | good = False 70 | sel_num_err += 1 71 | 72 | pred_sel_dict = {k:v for k,v in zip(list(sel_pred), list(agg_pred))} 73 | gt_sel_dict = {k:v for k,v in zip(sel_gt, agg_gt)} 74 | if set(sel_pred) != set(sel_gt): 75 | good = False 76 | sel_err += 1 77 | agg_pred = [pred_sel_dict[x] for x in sorted(pred_sel_dict.keys())] 78 | agg_gt = [gt_sel_dict[x] for x in sorted(gt_sel_dict.keys())] 79 | if agg_pred != agg_gt: 80 | good = False 81 | agg_err += 1 82 | 83 | cond_pred = pred_qry['conds'] 84 | cond_gt = gt_qry['conds'] 85 | strs_py3 = json.dumps(eval(str({'question': valid_d['question'], 'table': valid_d['table_id']})), ensure_ascii=False) + '\n' + \ 86 | json.dumps(eval(str({'sql_right': valid_d['sql']})), ensure_ascii=False) + '\n' + \ 87 | json.dumps(eval(str({'sql_pred': valid_d['sql_pred']})), ensure_ascii=False) + '\n' 88 | if len(cond_pred) != len(cond_gt): 89 | good = False 90 | cond_num_err += 1 91 | if PY3 and NEED_REWRITE_LOG: fh_where_cnt_err.write(strs_py3) 92 | 93 | else: 94 | cond_op_pred, cond_op_gt = {}, {} 95 | cond_val_pred, cond_val_gt = {}, {} 96 | for p, g in zip(cond_pred, cond_gt): 97 | cond_op_pred[p[0]] = p[1] 98 | cond_val_pred[p[0]] = p[2] 99 | cond_op_gt[g[0]] = g[1] 100 | cond_val_gt[g[0]] = g[2] 101 | 102 | if set(cond_op_pred.keys()) != set(cond_op_gt.keys()): 103 | cond_col_err += 1 104 | good = False 105 | if PY3 and NEED_REWRITE_LOG: fh_where_col_err.write(strs_py3) 106 | 107 | where_op_pred = [cond_op_pred[x] for x in sorted(cond_op_pred.keys())] 108 | where_op_gt = [cond_op_gt[x] for x in sorted(cond_op_gt.keys())] 109 | if where_op_pred != where_op_gt: 110 | cond_op_err += 1 111 | good = False 112 | if PY3 and NEED_REWRITE_LOG: fh_where_oper_err.write(strs_py3) 113 | 114 | 115 | where_val_pred = [cond_val_pred[x] for x in sorted(cond_val_pred.keys())] 116 | where_val_gt = [cond_val_gt[x] for x in sorted(cond_val_gt.keys())] 117 | 118 | if where_val_pred != where_val_gt: 119 | cond_val_err += 1 120 | good = False 121 | if PY3 and NEED_REWRITE_LOG: fh_where_val_err.write(strs_py3) 122 | 123 | if not good: 124 | tot_err += 1 125 | q_len = len(pred_queries) # 获取所有的个数 126 | print('Sel-Num: %.3f, Sel-Col: %.3f, Sel-Agg: %.3f, W-Num: %.3f, W-Col: %.3f, W-Op: %.3f, W-Val: %.3f, W-Rel: %.3f, total_err: %.3f' 127 | % (sel_num_err / q_len, sel_err / q_len, agg_err / q_len, 128 | cond_num_err / q_len, cond_col_err / q_len, cond_op_err / q_len, 129 | cond_val_err / q_len, cond_rela_err / q_len, tot_err / q_len)) 130 | return np.array((sel_num_err, sel_err, agg_err, cond_num_err, cond_col_err, cond_op_err, cond_val_err, cond_rela_err)), tot_err, tot_err/q_len # 这里返回的都是总数哦,需要特殊处理成占比 131 | 132 | if __name__ == "__main__": 133 | 134 | table_id = '4d258a053aaa11e994c3f40f24344a08' 135 | gt_qry = {"agg": [0], "cond_conn_op": 2, "sel": [4], "conds": [[1, 2, "搜房网"], [1, 2, "人人网"]]} 136 | pred_qry = {"agg": [0], "cond_conn_op": 2, "sel": [4], "conds": [[1, 2, "人人网"], [1, 2, "搜房网"]]} 137 | res = sqlite_oper.is_same_execute(table_id, gt_qry, pred_qry) 138 | print(res) 139 | import sys 140 | sys.exit(0) 141 | 142 | -------------------------------------------------------------------------------- /code/check_input_feature.py: -------------------------------------------------------------------------------- 1 | #! -*- coding: utf-8 -*- 2 | import json 3 | import codecs 4 | import jieba 5 | import editdistance 6 | import re 7 | import os 8 | import numpy as np 9 | import cn2an 10 | from question_prepro import * 11 | from config import * 12 | from utils import * 13 | 14 | # 正则表达式 15 | re_brack = "\\(.*?\\)|\\{.*?}|\\[.*?]|(.*?)|%" # 去掉括号里面的内容 16 | num_to_upper_dict = ['零', '一', '两', '三', '四', '五', '六', '七', '八', '九', '十'] 17 | upper_to_num_dict = {} 18 | for key, val in enumerate(num_to_upper_dict): 19 | upper_to_num_dict[val] = key 20 | 21 | 22 | def most_similar(source, target_list): 23 | """ 24 | 从词表中找最相近的词(当无法全匹配的时候) 25 | """ 26 | if len(target_list) == 0: 27 | return None 28 | s_set = set([item for item in source]) 29 | contain_score = [] 30 | un_contain_score = [] # target当中相比于source多出来的部分 31 | for target in target_list: 32 | t_set = set([t for t in target]) 33 | contain_score.append(len(s_set & t_set)) 34 | un_contain_score.append(0) 35 | char_match_score = [contain_score[idx] for idx in range(len(target_list))] 36 | # 如果最高匹配分数为0,说明一个匹配的都没有,那么返回None 37 | if max(char_match_score) == 0: return None 38 | # 下面计算编辑距离分数 39 | e_d_score = [ len(source) - editdistance.eval(source, t) for t in target_list] 40 | final_score = [char_match_score[idx] + e_d_score[idx] for idx in range(len(target_list))] 41 | return target_list[final_score.index(max(final_score))] 42 | 43 | 44 | def most_similar_out(source, target_list): 45 | """ 46 | 从词表中找最相近的词(当无法全匹配的时候) 47 | 这里做了修正,如果没有能够匹配的值的话,返回 -1 48 | """ 49 | 50 | if len(target_list) == 0: 51 | return None 52 | s_set = set([item for item in source]) 53 | contain_score = [] 54 | un_contain_score = []# target当中相比于source多出来的部分 55 | for target in target_list: 56 | t_set = set([t for t in target]) 57 | contain_score.append(len(s_set & t_set)) 58 | # un_contain_score.append(len(t_set.difference(s_set))) # 59 | un_contain_score.append(0) 60 | char_match_score = [contain_score[idx] * 4 for idx in range(len(target_list))] 61 | 62 | # 如果最高匹配分数为0,说明一个匹配的都没有,返回None 63 | if max(char_match_score) == 0: return None 64 | # 如果匹配分数为0,直接给最小分 65 | for idx in range(len(target_list)): 66 | if char_match_score[idx] == 0: 67 | char_match_score[idx] = -65530 68 | # 下面计算编辑距离分数 69 | e_d_score = [ len(source) - editdistance.eval(source, t) for t in target_list] 70 | final_score = [char_match_score[idx] + e_d_score[idx] for idx in range(len(target_list))] 71 | return target_list[final_score.index(max(final_score))] 72 | 73 | 74 | def most_similar_new(source, target_list): 75 | if re.findall('[^\d\-\.\%]', source): 76 | return most_similar_out(source, target_list) 77 | else: 78 | new_target_list = [target for target in target_list if check_num_exactly_match(source, target)[0] >= 1] 79 | if len(new_target_list) == 0: return None 80 | return new_target_list[0] if len(new_target_list) == 1 else most_similar_out(source, new_target_list) 81 | 82 | 83 | def treate_num_related_in_q(re_expre, question, cond_val): 84 | """处理question中的数字映射问题""" 85 | try: 86 | mat_re = re.compile(re_expre) 87 | q_mat = mat_re.findall(question) 88 | alab_num = upper_to_num_dict.get(q_mat[0][0]) 89 | question = question.replace(q_mat[0][0] + q_mat[0][1], str(alab_num) + q_mat[0][1]) 90 | return question 91 | except: 92 | return None 93 | 94 | 95 | class Subsets: 96 | # @param S, a list of integer 97 | # @return a list of lists of integer 98 | def __init__(self, max_len=5): 99 | self.max_len = max_len 100 | 101 | def dfs(self, start, S, result, father_subsets): 102 | 103 | if len(father_subsets) > self.max_len: return 104 | result.append(father_subsets) 105 | for i in range(start, len(S)): 106 | self.dfs(i+1, S, result, father_subsets+[S[i]]) 107 | def subsets(self, S): 108 | # none case 109 | if S is None: 110 | return [] 111 | # deep first search 112 | result = [] 113 | self.dfs(0, sorted(S), result, []) 114 | return result 115 | 116 | 117 | def most_similar_2(w, s, mode='input'): 118 | """从句子s中找与w最相近的片段, 119 | 借助分词工具和ngram的方式尽量精确地确定边界。 120 | w : cond value 121 | s: question 122 | 输入和输出的相似度函数不应该相同 123 | 对于输入来说: 进行自动标注的时候,是按照相邻原则来标记的,所以输入采用的相似度方法是n-gram 124 | 对于输出来说: xxx 125 | """ 126 | sw = jieba.lcut(s) 127 | sl = [x for x in list(sw)] 128 | if mode == 'output': # 这里只需要组合最大长度为5吧  129 | s_subset = Subsets().subsets(sw) 130 | sl = [''.join(item) for item in s_subset if len(item) > 0] 131 | elif mode == 'input': # 继续采用之前的匹配方式 132 | sl.extend([char for char in s]) 133 | sl.extend([''.join(i) for i in zip(sw, sw[1:])]) # 2-gram 134 | sl.extend([''.join(i) for i in zip(sw, sw[1:], sw[2:])]) # 3-gram 135 | sl.extend([''.join(i) for i in zip(sw, sw[1:], sw[2:], sw[3:])]) # 4-grarm 136 | sl.extend([''.join(i) for i in zip(sw, sw[1:], sw[2:], sw[3:], sw[4:])]) # 5-gram 137 | sl.extend([''.join(i) for i in zip(sw, sw[1:], sw[2:], sw[3:], sw[4:], sw[5:])]) # 6-gram 138 | sl.extend([''.join(i) for i in zip(sw, sw[1:], sw[2:], sw[3:], sw[4:], sw[5:], sw[6:])]) # 7-gram 139 | else: 140 | raise ValueError('Unsupported mode! ') 141 | return most_similar(w, sl) # delte in 08-19 142 | # return most_similar_out(w, sl) # modify in 08-19 143 | 144 | 145 | def alap_an_cn_mark(question, col_name, val): 146 | 147 | """ 148 | val 为数字可以通过quesiton的col_name来判断 149 | 通过列名称,找到匹配的位置,,然后顺次找到最近的数字 150 | 151 | Return start_pos: 数字开始位置 152 | end_pos: 数字结束位置 153 | val_in_q : 数字 154 | """ 155 | # col_name中的括号去掉 156 | col_name = re.sub(re_brack, "", col_name) 157 | question = trans_question_acc(question) 158 | col_in_question = most_similar_2(col_name, question) 159 | start_idx = 0 160 | if col_in_question is not None and col_in_question in question: 161 | start_idx = question.index(col_in_question) + len(col_in_question) 162 | elif col_in_question is not None:# 标题不在question里面,分散在里面 163 | pass 164 | else: 165 | return None, None, None 166 | pattern = re.compile(r'-\d+\.\d+|-\d+|\d+\.\d+|\d+') 167 | num_find = pattern.findall(question, start_idx) # 匹配到标题后的第一个数字 168 | if num_find is None: 169 | return 170 | try: 171 | start_idx = question.find(num_find[0], start_idx) # 第一个数字是我们想要标注的位置,找到他的起始位置 172 | end_idx = start_idx + len(num_find[0]) 173 | # print(start_idx, '\t', end_idx, '\t', question[start_idx:end_idx]) 174 | return start_idx, end_idx, question[start_idx:end_idx] 175 | except: 176 | print('except found') 177 | return None,None,None 178 | 179 | 180 | def alap_an_cn_mark_test(): 181 | question = '收入为-10.5的单位有哪些' 182 | col_name = '收入' 183 | word = '-10.5' 184 | assert alap_an_cn_mark(question, col_name, word) == (3, 8, '-10.5') 185 | 186 | question = '收入为-100的单位有哪些' 187 | col_name = '收入' 188 | word = '-100' 189 | assert alap_an_cn_mark(question, col_name, word) == (3, 7, '-100') 190 | 191 | question = '你好啊,我想知道出现次数大于8万,频率还高于0.1的都是什么词来着' 192 | col_name = '频率' 193 | val = '0.15666' 194 | assert alap_an_cn_mark(question, col_name, val) == (22, 25, '0.1') 195 | 196 | question = '你好啊,我想知道出现次数大于8万,频率还高于4325的都是什么词来着' 197 | col_name = '频率' 198 | val = '133' 199 | assert alap_an_cn_mark(question, col_name, val) == (22, 26, '4325') 200 | 201 | question = '你好啊,我想知道出现次数大于8万,频率还高于4万的都是什么词来着' 202 | col_name = '频率' 203 | val = '133' 204 | assert alap_an_cn_mark(question, col_name, val) == (22, 23, '4') 205 | 206 | question = '2020年通车高铁线路中长超过100公里,投资高于100亿的线路叫啥名呀' 207 | col_name = '线路长度(公里)' 208 | 209 | #"线路名称", "沿线地区", "线路长度(公里)", "投资金额(亿元)" 210 | val = '100' 211 | assert alap_an_cn_mark(question, col_name, val) == (15, 18, '100') 212 | 213 | question = '哪些股票是周涨跌幅小于0或年涨跌幅大于0的?' 214 | col_name = '投资金额(亿元)' 215 | 216 | #"线路名称", "沿线地区", "线路长度(公里)", "投资金额(亿元)" 217 | val = '100' 218 | assert alap_an_cn_mark(question, col_name, val) == (None, None, None) 219 | 220 | question = '请问在什么时候贷款利率调整前大于6%并且贷款利率调整后大于6%?' 221 | col_name = '贷款利率调整前' 222 | #"贷款利率调整前", "贷款利率调整后" 223 | val = '6' 224 | assert alap_an_cn_mark(question, col_name, val) == (16, 17, '6') 225 | 226 | question = '请问在什么时候贷款利率调整前大于6%并且贷款利率调整后大于6%?' 227 | col_name = '贷款利率调整后' 228 | #"贷款利率调整前", "贷款利率调整后" 229 | val = '6' 230 | assert alap_an_cn_mark(question, col_name, val) == (29, 30, '6') 231 | 232 | 233 | question = '我想知道上周5综艺收视率超过3%的,在湖南台播的都有几个啊' 234 | col_name = '收视率'# 百分号也干掉 235 | word = '0.3' 236 | assert alap_an_cn_mark(question, col_name, word) == (14, 15, '3') 237 | 238 | question = '哪些城市的成交面积在本周是低于2的' 239 | col_name = '本周成交面积' 240 | word = '1.67' 241 | assert alap_an_cn_mark(question, col_name, word) == (15, 16, '2') 242 | 243 | question = '有没有最新股价超过5块一股而且持股数量超过五百万股的模拟组合啊' 244 | col_name = '持股数量' 245 | word = '500' 246 | assert alap_an_cn_mark(question, col_name, word) == (21, 28, '5000000') 247 | 248 | question = '这周票房达到八千万以上的影片共有几部呀' 249 | col_name = '本周票房' 250 | word = '8000' 251 | assert alap_an_cn_mark(question, col_name, word) == (6, 14, '80000000') 252 | 253 | question = '电视剧收视率排名前3的都是什么剧啊,是在哪个台播的呀' 254 | col_name = '排名' 255 | word = '4' 256 | assert alap_an_cn_mark(question, col_name, word) == (9, 10, '3') 257 | 258 | 259 | question = '新房成交环比上周大于20%而且累计同比也大于20%的上周平均成交量为多少' 260 | col_name = '累计同比' 261 | word = '10' 262 | assert alap_an_cn_mark(question, col_name, word) == (22, 24, '20') 263 | 264 | 265 | question = '场均人次小于10而且上映了10天以上的电影最大累计票房为多少万' 266 | col_name = '上映天数' 267 | word = '10' 268 | assert alap_an_cn_mark(question, col_name, word) == (13, 15, '10') 269 | 270 | 271 | 272 | 273 | if __name__ == "__main__": 274 | alap_an_cn_mark_test() -------------------------------------------------------------------------------- /code/config.py: -------------------------------------------------------------------------------- 1 | import sys 2 | model_path = "../data" 3 | # base_path = "../data" 4 | 5 | model_bert_wwm_path = '../data/' 6 | train_data_path = '../data/train/' 7 | valid_data_path = '../data/valid/' 8 | test_file_path = "/tcdata" 9 | 10 | test_submit_path = "../result.json" 11 | log_path = '../data/logs' 12 | prepare_data_path = '../data/prepare_data' 13 | 14 | PY2 = sys.version_info[0] == 2 15 | PY3 = sys.version_info[0] == 3 16 | 17 | # data to sqlite 18 | agg_dict = {0:"", 1:"AVG", 2:"MAX", 3:"MIN", 4:"COUNT", 5:"SUM"} 19 | cond_op_dict = {0:">", 1:"<", 2:"==", 3:"!="} 20 | rela_dict = {0:'', 1:' AND ', 2:' OR '} 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | MODEL_PATH = "../data" 29 | MODEL_BERT_WWM_PATH = '../data/' 30 | TRAIN_DATA_PATH = '../data/train' 31 | VALID_DATA_PATH = '../data/valid' 32 | TEST_FILE_PATH = '/tcdata' 33 | 34 | TEST_SUBMIT_PATH = '../result.json' 35 | LOG_PATH = '../data/logs' 36 | PREPARE_DATA_PATH = '../data/prepare_data' 37 | 38 | PY2 = sys.version_info[0] == 2 39 | PY3 = sys.version_info[0] == 3 40 | 41 | AGG_DICT = {0:"", 1:"AVG", 2:"MAX", 3:"MIN", 4:"COUNT", 5:"SUM"} 42 | COND_OP_DICT = {0:">", 1:"<", 2:"==", 3:"!="} 43 | RELA_DICT = {0:'', 1:' AND ', 2:' OR '} 44 | 45 | 46 | BERT_CONFIG_PATH = MODEL_BERT_WWM_PATH + 'bert_config.json' 47 | BERT_CKPT_PATH = MODEL_BERT_WWM_PATH + 'bert_model.ckpt' 48 | BERT_VOCAB_PATH = MODEL_BERT_WWM_PATH + 'vocab.txt' 49 | 50 | WEIGHT_SAVE_PATH = MODEL_PATH + 'weights/nl2sql_finetune.weights' 51 | 52 | 53 | 54 | 55 | class Config(object): 56 | def __init__(self, **kwargs): 57 | for key, value in kwargs.items(): 58 | self.__setattr__(key, value) 59 | 60 | def add_argument(self, key, value): 61 | self.__setattr__(key, value) 62 | 63 | 64 | config = Config( 65 | model_path=MODEL_PATH, 66 | model_bert_wwm_path=MODEL_BERT_WWM_PATH, 67 | train_data_path=TRAIN_DATA_PATH, 68 | valid_data_path=VALID_DATA_PATH, 69 | test_file_path=TEST_FILE_PATH, 70 | test_submit_path=TEST_SUBMIT_PATH, 71 | log_path=LOG_PATH, 72 | prepare_data_path=PREPARE_DATA_PATH, 73 | agg_dict=AGG_DICT, 74 | cond_op_dict=COND_OP_DICT, 75 | rela_dict=RELA_DICT 76 | ) 77 | 78 | 79 | 80 | 81 | -------------------------------------------------------------------------------- /code/dbengine.py: -------------------------------------------------------------------------------- 1 | # -*- coding:utf-8 -*- 2 | import json 3 | import records 4 | import re 5 | from config import * 6 | 7 | class DBEngine: 8 | def __init__(self, fdb): 9 | self.db = records.Database('sqlite:///{}'.format(fdb)) 10 | self.conn = self.db.get_connection() 11 | 12 | def execute(self, table_id, select_index, aggregation_index, conditions, condition_relation): 13 | """ 14 | table_id: id of the queried table. 15 | select_index: list of selected column index, like [0,1,2] 16 | aggregation_index: list of aggregation function corresponding to selected column, like [0,0,0], length is equal to select_index 17 | conditions: [[condition column, condition operator, condition value], ...] 18 | condition_relation: 0 or 1 or 2 19 | """ 20 | table_id = 'Table_{}'.format(table_id) 21 | 22 | # 条件数>1 而 条件关系为'' 23 | if condition_relation == 0 and len(conditions) > 1: 24 | return 'Error1' 25 | # 选择列或条件列为0 26 | if len(select_index) == 0 or len(conditions) == 0 or len(aggregation_index) == 0: 27 | return 'Error2' 28 | 29 | condition_relation = rela_dict[condition_relation] 30 | 31 | select_part = "" 32 | for sel, agg in zip(select_index, aggregation_index): 33 | select_str = 'col_{}'.format(sel+1) 34 | agg_str = agg_dict[agg] 35 | if agg: 36 | select_part += '{}({}),'.format(agg_str, select_str) 37 | else: 38 | select_part += '({}),'.format(select_str) 39 | select_part = select_part[:-1] 40 | 41 | where_part = [] 42 | for col_index, op, val in conditions: 43 | if PY3: 44 | where_part.append('col_{} {} "{}"'.format(col_index+1, cond_op_dict[op], val)) 45 | else: 46 | where_part.append('col_{} {} "{}"'.format(col_index+1, cond_op_dict[op], val.encode('utf-8'))) 47 | where_part = 'WHERE ' + condition_relation.join(where_part) 48 | 49 | query = 'SELECT {} FROM {} {}'.format(select_part, table_id, where_part) 50 | if PY2: 51 | query = query.decode('utf-8') 52 | try: 53 | out = self.conn.query(query).as_dict() 54 | except: 55 | return 'Error3' 56 | 57 | # result_set = [tuple(set(i.values())) for i in out] 58 | if PY2: 59 | result_set = [tuple(sorted(i.values())) for i in out] 60 | else: 61 | result_set = [tuple(sorted(i.values(), key=lambda x:str(x))) for i in out] 62 | return result_set -------------------------------------------------------------------------------- /code/hand_set.py: -------------------------------------------------------------------------------- 1 | get_val_by_pos_hand_set = set([ 2 | '哪些楼盘平均售价低于2万或者容积率小于2', 3 | '容积率小于2或者楼盘平均下来卖价低于2万块每平的是哪些楼盘', 4 | '想咨询一下5月份上海有哪些楼盘的均价在20000/㎡以上同时月环比涨幅也是大于5的?', 5 | '我想查询一下本周成交面积超过1.5的城市或者是上周成交面积超过1的城市也行', 6 | '19年第1周有哪些电影周票房超过10000000并且票房占比高于10%的?', 7 | '你好,平均票价低于10美元,而且可支配收入低于4万美元,那么平均票价与可支配收入的比值你知道吗', 8 | '有哪些证券B的商誉B大于0.1亿元而且净资产大于0.1的?', 9 | '哪些电影单周票房超过了1亿或者累计票房小于1亿', 10 | '有几个国家电影平均票价低于10美元的,并且啊可支配收入小于3万的呀', 11 | '你好啊,你帮我看看现在有多少个国家电影平均票价小于10美元,可支配收入还小于3万的呀', 12 | '数数看电影平均票价低于10美元的,并且可支配收入小于3万的有几个国家啊', 13 | '住房3个月移动日均成交量高于30000平方米,那可以销售的面积和两个周期内的变化比情况怎样', 14 | '我就想知道环比和销售面积啊,它3个月移动日均成交量高于30000平方米的', 15 | '在12年这一个星期成交的面积超过5而且环比也在5以上的城市都有哪些?', 16 | '近年年房地产销售面积预测,一线城市小于4000万平或者二线城市小于400000000平的是哪几年', 17 | '哪几年的房地产销售面积预测在一线城市小于4000万平或者二线城市小于400000000平', 18 | '你知道哪些驾校排名前3的吗', 19 | '合格率排名前3的驾校叫啥名啊', 20 | '那个12月29号省级卫视晚间综艺节目收视率排名前3的都是哪些综艺,在哪个台播的', 21 | '17年度中国网络作家富豪榜排名前3的是哪些作家啊,他们版税多少啊', 22 | '你好啊,我想问问啊就是17年版税收入排名前3的都是哪些作家啊,他们的版税分别有多少啊', 23 | '呃你知道哪些作家在17年的中国网络作家富豪榜中名列前3的呀,那他们具体版税又有多少呢', 24 | '新房成交环比上周大于20%而且累计同比也大于20%的上周平均成交量为多少', 25 | '哪些城市的成交面积在本周是低于2的', 26 | '本周的一个住房成交情况怎么样啊,低于2的多不多,分布在哪些城市', 27 | '股价大于4块五而且总市值大于450的公司是哪个', 28 | '每套面积都大于100平,还有平均售价小于2万的是北京哪些楼盘啊,都是北京哪的呀', 29 | '诶,那个平均成交价低于2万,平均每套面积还大于100平的是哪些楼盘啊,在北京哪的啊', 30 | '你帮我看看北京哪里有楼盘成交均价低于2万,平均每套面积大于100平的呀,这些楼盘都叫啥名啊', 31 | '19年1月14号到20号票房排名前3的都是哪些影片啊,上映有多少天啊', 32 | '那个哪些影片在19年1月14号到20号期间票房排名前3的呀,都上映多久了呀', 33 | '请跟我说一下这个星期收盘的价格高于10块钱,这周的涨跌幅也在0.05以上的证券名,谢谢。', 34 | '请问近4周周均成交环比大于3并且同比大于30的重点城市有哪些呀?', 35 | '能不能查询哪一年商品房开发投资总额超过600亿而且施工面积的投资额大于5万块1平方米', 36 | '淡水河谷公司铁矿石产量高于3亿吨和必和必拓公司的高于1.7亿吨的每年总的产量是多少', 37 | '电视剧收视率排名前3的都是什么剧啊,是在哪个台播的呀', 38 | '诶,你知道哪个台播的电视剧收视率排名前3的吗,都是啥剧啊', 39 | '我问你啊那个收视率排在前3名的都是哪个台播的什么剧啊', 40 | '哪些城市的去化时间在本周超过了1年或者在上周超过了1年', 41 | '那个京沪高铁有哪几年是平均每日客流量都达到20万人以上的,或者净利润高于50亿的呀', 42 | '我想问一下啊就是京沪高铁日均客流量超过20万人次的,或者是净利润高达50亿的都是哪些年啊', 43 | '2018年12月最后一周国产动漫播放次量排名前3的都是什么国漫啊,在哪些平台播放啊', 44 | '诶,你知道18年12月24到30的时候国漫播放量排名前3的国漫都是在哪播放的吗,都是什么动漫啊', 45 | '呃那个哪些国漫在18年第52周国漫播放量排名前3的呀,在哪播的呀', 46 | '上周末库存去化周期超过1年或者库存去化周期环比超过08的城市有多少', 47 | '哪些城市能达到库存去化周期环比超过0.8或者上周末库存去化周期超过1年的', 48 | '11年每股盈余高于1毛,预计12年的每股盈余也高于1毛的地产公司有哪些?', 49 | '你知道什么公司一一年每股收益超过0.1元,估计12年的每股收益也会超过0.1元的吗?', 50 | '麻烦帮我查一下那些2011年每股税后利润达到1角以上,2012年的每股税后利润估值也达到1角以上的公司名吧', 51 | '流通A股占总股本比例低于60%或者周成交小于1亿股的股票周换手率是多少', 52 | '你知道像流通A股占总股本比例低于60%或者周成交小于1亿股这样的股票周换手率为多少吗', 53 | '你知道股票的周换手率是多少吗,它的流通A股占总股本比例低于60%或者周成交不到1亿股', 54 | '哪些城市的土地成交面积2011同期低于5000万平或2012年至今不足5000万平', 55 | '请问有没有库存在5万以上的城市而且这周销量又超过了1000的城市', 56 | '19年1月14号到18号涨幅排名前3的都是哪些公司啊,股价多少啊', 57 | '那个19年1月14号到18号哪些公司排在涨幅前3的呀,这些公司股价多少来着', 58 | '今年第1周电视综艺播放量排名前3的都是哪些电视综艺啊,播放量多少来着呀', 59 | '你知道那个今年第1周综艺播放量排前3的播放量分别是多少啊,都是什么综艺节目的呀', 60 | '哪些城市的上周成交面积超过了11或者本周成交面积超过5的', 61 | '已经知道城市库存去化周期同比地域4并且库存去化周期环比也不足与1,那么它较上年去化周期怎么样', 62 | '有没有最新股价超过5块一股而且持股数量超过5000000股的模拟组合啊', 63 | '2010年H1不足1年的城市去年同期的去化时间最高值为多少或者2010年H2一线城市去化时间不足1年的最大值', 64 | '想要知道这周成交超过30000平方米的城市中有哪个在上周也超过30000平方米', 65 | '想要问一下2012年6月19日有没有哪个城市上周住宅用地楼面价超过400块一平而且成交面积超过400000平', 66 | '本周成交面积低于9或者环比超过-63.05的城市,在上周成交了多少面积', 67 | '啊,那个上周的成交面积多少啊,你帮我着重查一下环比数超过-63.05或者本周成交面积低于9的城市哈', 68 | '3月楼盘套数超过100而且均价超过2万的楼盘有哪些?', 69 | '请你跟我说说3月楼盘套数达到100套以上且均价超过2万的楼盘有哪些?', 70 | '我想知道你们月楼盘套数高于100套以上而且均价达到2万以上的楼盘有哪些呢?', 71 | '你知道容积率高于1,平均每套还大于100平以及成交均价高于8千的天津新盘有多少个吗', 72 | '力拓的全球铁矿石产量低于3亿吨或者FMG高于1亿吨的年份是哪几年', 73 | '在哪几个年份里,FMG的铁矿石产量高于了1亿吨或者力拓是低于3亿吨的', 74 | '2012E每股收益大于5毛或者2013E每股收益大于5毛的股票2012E本益比是多少', 75 | '19年第7周电视综艺播放量排名前2总共有多大播放量', 76 | '诶,那个综艺类型的节目的播放数量在19年第7周的时候排名在前2的加起来播放数有多大啊', 77 | '你帮我算算那个19年2月18到2月24的电视的综艺节目排在前2名的播放数量一共是多少啊', 78 | '哪个城市物业面积超过50万方租赁收入超过50000000', 79 | '租赁收入在5千万以上物业面积超过50万方的城市是哪个', 80 | '平均价格高于10美元的,或者是可支配收入大于3万美元都是哪些国家啊,总票房多少啊', 81 | '你好啊,麻烦你帮我查一下那个有哪些国家电影平均票价大于10美元,或者可支配收入高于3万美元的呀,这些国家票房多少啊', 82 | '最新市值低于10000000并且市值比重不足10个百分点的股,最新股价为多少', 83 | '您好,我问一下,最新的股价出来了吗,能不能告诉我新市值低于10000000而且市值比重不足10个百分点的股票股价啊,谢谢', 84 | '你好啊,中国IOS游戏畅销排行榜中排名前3的都是什么游戏啊,是哪家公司研发的呀', 85 | '你知道那个中国IOS游戏畅销排行榜前3的都是哪些公司研发的吗,还有都是哪些游戏啊', 86 | '网络剧全网热度排名前3的都是哪些剧,当天最高热度为多少啊', 87 | '你帮我看一下啊网络剧全网热度排名前3的当天热度最高为多少啊,都是什么剧啊', 88 | '我想知道那个网络剧全网热度排名前3的都是什么剧,那这些网剧当天热度最高为多少啊', 89 | '开盘大于200套或者已签约套数超过200套的是什么项目', 90 | '哪个项目开盘大于200套或者已签约套数超过200套的', 91 | '有没有开盘大于200套或者已签约套数超过200套的项目,项目叫什么', 92 | '有几支港股的总市值是低于20亿港元或者周成交量小于1亿港元的', 93 | '总市值低于20亿港元或者周成交量小于1亿港元的港股有几支', 94 | '你知道总市值低于20亿港元或者周成交量小于1亿港元的证券简称有多少吗', 95 | '19年第四个星期有几部电影的票房达到5000000以上,其票房的占比也在5%以上的呀?', 96 | '1月12号省级卫视晚间综艺节目收视率排名前3的市场份额一共有多少啊', 97 | '诶,你帮我算一算那个1月12号省级卫视晚间综艺节目收视率排名前3的那个市场份额加起来有多少啊', 98 | '全球半导体销售额2017年大于300亿美元而且2018年也大于300亿美元的地区有哪几个', 99 | '想要了解一下PE-TTM10高1同时PB也在1以上的汽车电子板块股票都有哪些?', 100 | '单周票房低于1亿而且累计票房低于9000亿的电影最多上映了多少天', 101 | '这电影最多上映几天啊,它的单周的电影票房低于1亿而且累计票房小于9000亿,这么低', 102 | '小姐姐,请问单周票房低于1亿而且累计票房小于9000亿的电影,最多可以上映几天啊', 103 | '18E每股收益大于5角而且19E每股收益也大于5角的股票股价最小为多少', 104 | '我很好奇在18E和19E每股收益都超过5毛的所有股票中,他们的股价中最低值是多少', 105 | '我想找出有哪些正极企业总投资是大于10亿元的货扩产的产能大于1万吨的。', 106 | '总投资的金额是超过10亿的正极企业有哪些或者扩充产能超过1万吨的企业', 107 | 'A股房地产股的最新市值是多少,它的最新股价是大于10块而且本周涨幅前10大于10%的', 108 | '我可以通过A股房地产股最新股价大于10块而且本周涨幅前10大于10%查询它的最新市值吗', 109 | '最新市值大于66亿而且最新股价大于6块6的地产板块的证券代码是什么', 110 | '请问一下有没有地产板块的公司最新的市值超过66亿还有最新的股票价格超过6块6,有的话对应的证券代码是什么', 111 | '那个19年第2周电视剧和网剧总播放量排名前3的都是哪些剧,播放量如何', 112 | '你帮我看一下啊那个哪些剧在19年第2周电视剧和网剧总播放量排名前3的呀,多少播放量啊', 113 | '你知道那些19年第2周电视剧和网剧总播放量排名前3的分别是多少播放量吗,还有啊前3的都是什么剧啊', 114 | '18年最后一周畅销书排行榜排行前3的有哪些畅销书啊', 115 | '我想知道就是18年第52周排在前3的都是哪些虚构和非虚构的书啊', 116 | '诶,哪些书在2018年12月24日到12月30的时候排在畅销书排行榜前3的呀', 117 | '这期大于200000平的城市里面有没有上期也大于200000平的城市', 118 | '哪些书的总字数超过了200000字,而且撰写字数也是超过200000字的', 119 | '诶你知道什么单位的岗位是要招2人或者2人以上的吗,这些单位你知道它们对学历有没有什么要求吗', 120 | '合格率排名前3的驾校叫啥名啊', 121 | '你知道哪些驾校排名前3的吗', 122 | '诶你帮我看看哪些词频率大于0.1,出现次数还高于8万的呀', 123 | '我想知道排名在世界前3的是什么学校' 124 | ]) -------------------------------------------------------------------------------- /code/new_mark_acc_ensure.py: -------------------------------------------------------------------------------- 1 | from hand_set import * 2 | from question_prepro import * # 需要里面的文件返回函数 3 | 4 | from config import * 5 | from check_input_feature import * 6 | from utils import * 7 | 8 | 9 | q_correct_path = os.path.join(prepare_data_path, 'new_q_correct') # 不区分类型的 正确匹配 10 | q_no_num_similar_path = os.path.join(prepare_data_path, 'new_q_no_num_similar') # 非数字的,通过相似函数可以匹配正确的 11 | q_num_double_more_path = os.path.join(prepare_data_path, 'q_num_double_more') 12 | q_need_col_similar_path = os.path.join(prepare_data_path, 'new_q_need_col_sim') 13 | q_one_vs_more_col_path = os.path.join(prepare_data_path, 'new_q_one_vs_more_col') 14 | q_need_exactly_match_path = os.path.join(prepare_data_path, 'new_q_exactly_match') 15 | q_need_exactly_match_more_strict_path = os.path.join(prepare_data_path, 'new_q_exactly_more_strict_match') 16 | q_text_contain_similar_path = os.path.join(prepare_data_path, 'new_q_text_contain_similar') 17 | q_real_text_mix_path = os.path.join(prepare_data_path, 'new_q_exactly_more_strict_match') 18 | 19 | train_data, train_tables = read_data( 20 | os.path.join(train_data_path, 'train.json'), 21 | os.path.join(train_data_path, 'train.tables.json') 22 | ) # 41522 5013 23 | 24 | table_types = {} 25 | table_headers = {} 26 | 27 | for d in train_tables: 28 | types = train_tables[d]['types'] 29 | table_types[d] = types 30 | 31 | table_headers[d] = train_tables[d]['headers'] 32 | 33 | # 经过简单匹配,可以找出那些官方标注中有明显问题的样本 34 | wrong_mark_official = set([ 35 | '你知道新房上周成交量和当月累计成交量都大于100万平的是哪些城市吗', 36 | '成交面积在本周或者上周都大于14万平的城市有哪些', 37 | '你知道那些成交面积在本周或者上周都超过14万平的城市吗', 38 | '请问吉林省它的保障房数量在2011年超过了,那么2012年是多少呢?', 39 | '涨幅和溢价率都大于20%的股票重估净资产是多少', 40 | '股票重估净资产多少的时候它的涨幅以及溢价率都会超过20%', 41 | '你好,是这样,我想问一下像涨幅和溢价率都大于20%这样的股票重估净资产达到了多少', 42 | '设计时速等于500公里每小时,或者投资总额205亿元的线路是哪条?', 43 | '你知道全球排名前3的学校是哪几间吗', 44 | '你帮我查一下排在全球前5的是哪个国家的大学来着', 45 | '你好,你知道目前排在前5名的是什么国家的大学吗', 46 | '排名前5的大学分别是哪些国家的', 47 | '你好,你帮我查一下目前全球排名前3的学校', 48 | '你知道全球排名前3的学校是哪几间吗', 49 | '请问有没有18年12月的时候超过4块钱收盘的证券啊,这些证券代码给我一下', 50 | '哪几款机器人在2016销售量可以超过4800而且占市场总销量可达90', 51 | '你好,为了调查2017年机器人本体市场国产厂商比重情况,我想了解一下2016年的机器人款型,名称,特别是销量超4800.占比超90%的机器人厂商', 52 | '西北省市保障房计划的十二五规划情况怎么样,特别是2012年的', 53 | '请问哪一个城市在2010的时候成交面积超过了200', 54 | '可以查查有没有哪个城市2010成交面积高于200的', 55 | '请问一下2012年6月17日A股房地产股最新股票价格大于50块而且最新市值超过450亿的证券代码是哪个', 56 | '111111111111' 57 | ]) 58 | 59 | # 经过简单匹配,可以找出那些官方标注中有明显问题的样本 60 | bad_question = set([ 61 | '听说产线被关停了,为什么啊,具体原因呢', 62 | '产线关停,大新闻啊,什么时候,为什么,以后还能不能恢复', 63 | '呃呃那个上周被禁二手房成交量达到多少啊,还有这个月的成交量呢', 64 | '你能帮我算一下这几只股票的平均股价吗?', 65 | '我想知道上周收盘价最高达到了多少?', 66 | '你知道人文学院招聘哪些岗位吗,代码是什么,招多少人呀', 67 | '人文学院开始招聘了,麻烦告诉我有哪些岗位在招人,招多少人,岗位代码是什么', 68 | '你好,我想了解一下人文学院提供了什么岗位吗,它们的岗位代码是什么呀,人数有多少啊', 69 | '你好啊我想要知道的是什么出版社出版的《阿尔喀比亚德》和《阿尔喀比亚德》这两本书', 70 | '你看过做智慧班主任这本书吗,我想问一下它的出版单位是谁', 71 | '地产板块中的换手股的收盘价和周换手率都是知道的,就是不知道股名,哎呀,能不能告诉我一下', 72 | '这些线路的起始站和终点站是哪,什么时候开通', 73 | '为了更好地计算同比数,请务必告知近两期的土地成交情况', 74 | '听说产线被关停了,为什么啊,具体原因呢', 75 | '产线关停,大新闻啊,什么时候,为什么,以后还能不能恢复', 76 | '我想知道上周收盘价最高达到了多少?', 77 | '你能帮我算一下这几只股票的平均股价吗?', 78 | '我想调查一下日成交环比,但是目前我只知道最近7天的一个成交量' 79 | ]) 80 | 81 | 82 | def get_correct_q(file_path, mode='write', unwanted=set([])): 83 | """ 84 | - 所有的条件之必须在q中出现过,而且出现的次数必须等于1, 85 | - 在conds中不能出现条件值相同(排除那些一词对应多列的情况) 86 | """ 87 | d_s = set([]) 88 | if mode == 'write': 89 | f_h = open(file_path, 'w') 90 | for d in train_data: 91 | question = d['question'] 92 | 93 | if question in unwanted: continue 94 | conds = d['sql']['conds'] 95 | types = table_types[d['table_id']] 96 | header = table_headers[d['table_id']] 97 | exact_match = True 98 | question = trans_question_acc(question) 99 | all_correct = True 100 | con_val_list = [cond[2] for cond in conds] 101 | q_op_mark = [0] * len(question) 102 | for cond in conds: 103 | if cond[2] in question and con_val_list.count(cond[2]) == 1: 104 | if (types[cond[0]] == 'real' and check_num_exactly_match(cond[2], question)[0] !=1) or\ 105 | (types[cond[0]] == 'text' and question.count(cond[2]) != 1 ): 106 | all_correct = False 107 | break 108 | if max(q_op_mark[question.index(cond[2]): question.index(cond[2]) + len(cond[2])]) == 1: 109 | all_correct = False 110 | break 111 | q_op_mark[question.index(cond[2]): question.index(cond[2]) + len(cond[2])] = [1] * len(cond[2]) 112 | else: 113 | all_correct = False 114 | break 115 | if all_correct == True: 116 | d_s.add(question + '\n') 117 | f_h.writelines(list(d_s)) 118 | elif mode == 'read': 119 | f_h = open(file_path, 'r') 120 | for line in f_h.readlines(): 121 | d_s.add(line[:-1]) 122 | return d_s 123 | else: 124 | raise ValueError('unsupported mode ') 125 | 126 | if not os.path.exists(q_correct_path): 127 | get_correct_q(q_correct_path, mode='write', unwanted=wrong_mark_official) 128 | correct_q_set = get_correct_q(q_correct_path, mode='read', unwanted=wrong_mark_official) 129 | assert len(correct_q_set) == 28052 # 28052 130 | 131 | 132 | 133 | def get_no_num_similar(file_path, mode='write', unwanted=set([])): 134 | """ 135 | 获取条件值不是数字,而且通过similar函数可以匹配正确的 136 | mode: 'write' or 'read' 137 | unwanted: 排除掉的question集合 138 | """ 139 | d_s = set([]) 140 | if mode == 'write': 141 | f_h = open(file_path, 'w') 142 | for d in train_data: 143 | question = d['question'] 144 | conds = d['sql']['conds'] 145 | types = table_types[d['table_id']] 146 | header = table_headers[d['table_id']] 147 | question = trans_question_acc(question) # 转化是必须的 148 | if question in unwanted: continue 149 | type_set = set([types[cond[0]] for cond in conds ]) 150 | if 'real' in type_set: continue # 获取非数字 151 | good = True 152 | q_op_mark = [0] * len(question) 153 | for cond in conds: 154 | if cond[2] in question: 155 | sim = cond[2] 156 | else: 157 | sim = most_similar_2(cond[2], question) 158 | if sim is None: 159 | good = False 160 | break 161 | if max(q_op_mark[question.index(sim): question.index(sim) + len(sim)]) == 1: 162 | good = False 163 | break 164 | q_op_mark[question.index(sim): question.index(sim) + len(sim)] = [1] * len(sim) 165 | if good == True: 166 | d_s.add(question + '\n') 167 | f_h.writelines(list(d_s)) 168 | 169 | elif mode == 'read': 170 | f_h = open(file_path, 'r') 171 | for line in f_h.readlines(): 172 | d_s.add(line[:-1]) 173 | return d_s 174 | else: 175 | raise ValueError('unsupported mode ') 176 | 177 | 178 | if not os.path.exists(q_no_num_similar_path): 179 | get_no_num_similar(q_no_num_similar_path, mode='write', unwanted=wrong_mark_official|correct_q_set) 180 | no_num_similar_set = get_no_num_similar(q_no_num_similar_path, mode='read', unwanted=wrong_mark_official|correct_q_set) 181 | assert len(no_num_similar_set) == 7020 182 | 183 | 184 | def q_one_vs_more_col(file_path, mode='write', unwanted=set([])): 185 | """ 186 | 获取cond的个数大于1 并且cond中val的值都相同 187 | 另外question中的val只出现一次 188 | 189 | 需要条件值全是数字 190 | """ 191 | unwanted = unwanted | set(['超过30万字,而且页数还超300的是什么书', 192 | '你知道哪些书字数超30万,页数也超300的吗', 193 | '我想问问你啊就是哪些书超过300页,超过30万字的吗', 194 | '单周票房多少的电影,他的人均的场次低于10,但是上映时间在十天以上的']) 195 | cnts = 0 196 | if mode == 'write': 197 | f_h = open(file_path, 'w') 198 | for d in train_data: 199 | question = d['question'] 200 | 201 | conds = d['sql']['conds'] 202 | types = table_types[d['table_id']] 203 | header = table_headers[d['table_id']] 204 | question = trans_question_acc(question) # 转化是必须的 205 | if question in unwanted: continue 206 | vals = set([cond[2] for cond in conds]) 207 | if len(vals) == len(conds) : continue 208 | is_good = True 209 | for val in vals: 210 | try: 211 | int(float(val)) 212 | except: 213 | is_good = False 214 | continue 215 | if check_num_exactly_match(val, question)[0] != 1 \ 216 | and check_num_exactly_match_zero_case(val, question)[0] != 1: 217 | is_good = False 218 | break 219 | cnts += 1 220 | if is_good == True: 221 | f_h.write(question + '\n') 222 | elif mode == 'read': 223 | with open(q_one_vs_more_col_path, 'r') as f: 224 | return set([line[:-1] for line in f.readlines()]) 225 | 226 | if not os.path.exists(q_one_vs_more_col_path): 227 | q_one_vs_more_col(q_one_vs_more_col_path, 228 | mode='write', unwanted=wrong_mark_official|correct_q_set|no_num_similar_set) 229 | q_one_vs_more_col_set = q_one_vs_more_col(q_one_vs_more_col_path, 230 | mode='read', unwanted=wrong_mark_official|correct_q_set|no_num_similar_set) 231 | 232 | assert len(q_one_vs_more_col_set) == 1349 233 | 234 | 235 | def q_need_exactly_match(file_path, mode='write', unwanted=set([])): 236 | """ 237 | 获取cond的个数可以是多个,但是需要保证,每个值都可以通过exactly方法进行匹配 238 | 即 20和2011虽然q.find()是可以定位的,但是显然,这个定位是错误的。 239 | 那么需要find一步,一步的来 240 | 需要条件值全是数字哦 241 | """ 242 | cnts = 0 243 | if mode == 'write': 244 | f_h = open(file_path, 'w') 245 | for d in train_data: 246 | question = d['question'] 247 | conds = d['sql']['conds'] 248 | types = table_types[d['table_id']] 249 | header = table_headers[d['table_id']] 250 | question = trans_question_acc(question) # 转化 251 | if question in unwanted: continue 252 | is_good = True 253 | for cond in conds: 254 | try: 255 | int(cond[2]) 256 | except: 257 | is_good = False 258 | break 259 | if question.count(cond[2]) > 1: 260 | cnt = check_num_exactly_match(cond[2], question)[0] 261 | if cnt != 1: 262 | is_good = False 263 | break 264 | elif question.count(cond[2]) == 0: 265 | is_good = False 266 | if is_good: 267 | f_h.write(question + '\n') 268 | elif mode == 'read': 269 | with open(file_path, 'r') as f: 270 | return set([line[:-1] for line in f.readlines()]) 271 | 272 | if not os.path.exists(q_need_exactly_match_path): 273 | q_need_exactly_match(q_need_exactly_match_path, 274 | mode='write',unwanted=wrong_mark_official|correct_q_set|no_num_similar_set| q_one_vs_more_col_set) 275 | 276 | q_need_exactly_match_set = q_need_exactly_match(q_need_exactly_match_path, 277 | mode='read',unwanted=wrong_mark_official|correct_q_set|no_num_similar_set| q_one_vs_more_col_set) 278 | 279 | assert len(q_need_exactly_match_set) == 368 280 | 281 | 282 | def q_need_exactly_match_more_strict(file_path, mode='write', unwanted=set([])): 283 | """ 284 | 更加严格的匹配 20就是和20匹配上,并不能匹配上2000 285 | """ 286 | cnts = 0 287 | if mode == 'write': 288 | f_h = open(file_path, 'w') 289 | for d in train_data: 290 | question = d['question'] 291 | conds = d['sql']['conds'] 292 | types = table_types[d['table_id']] 293 | header = table_headers[d['table_id']] 294 | question = trans_question_acc(question) # 转化是必须的 295 | if question in unwanted: continue 296 | is_good = True 297 | mark_q = [0] * len(question) 298 | for cond in conds: 299 | try: 300 | int(cond[2]) 301 | except: 302 | is_good = False 303 | break 304 | if question.count(cond[2]) >= 1: 305 | cnt_info = check_num_exactly_match_zero_case(cond[2], question) 306 | if cnt_info[0] != 1: 307 | is_good = False 308 | break 309 | if max(mark_q[cnt_info[1]: cnt_info[2] + 1]) > 0 : 310 | is_good = False 311 | break 312 | mark_q[cnt_info[1]: cnt_info[2] + 1] = [1] * (cnt_info[1] + 1 - cnt_info[0]) 313 | elif question.count(cond[2]) == 0: 314 | is_good = False 315 | if is_good: 316 | f_h.write(question + '\n') 317 | elif mode == 'read': 318 | with open(file_path, 'r') as f: 319 | return set([line[:-1] for line in f.readlines()]) 320 | 321 | if not os.path.exists(q_need_exactly_match_more_strict_path): 322 | q_need_exactly_match_more_strict(q_need_exactly_match_more_strict_path, 323 | mode='write',unwanted=wrong_mark_official|correct_q_set|no_num_similar_set| q_one_vs_more_col_set|q_need_exactly_match_set) 324 | q_need_exactly_match_more_strinct_set = q_need_exactly_match_more_strict(q_need_exactly_match_more_strict_path, 325 | mode='read',unwanted=wrong_mark_official|correct_q_set|no_num_similar_set| q_one_vs_more_col_set|q_need_exactly_match_set) 326 | assert len(q_need_exactly_match_more_strinct_set) == 342 327 | 328 | # b_c = 0 329 | # uw = correct_q_set|no_num_similar_set| q_one_vs_more_col_set|q_need_exactly_match_set|q_need_exactly_match_more_strinct_set 330 | # f_h = open(q_num_double_more_path, 'r') 331 | 332 | 333 | def q_text_contain_similar(file_path, mode='write', unwanted=set([])): 334 | """ 335 | 336 | """ 337 | d_s = set([]) 338 | unwanted = unwanted | set([ 339 | '强烈推荐评级为A并且股价超过30的重点公司总共有多少家?', 340 | '一共有多少家重点公司强烈推荐评级为A并且他的股票价格高于30块钱一股的?', 341 | '这些重点公司强烈推荐评级为A并且股票的价格超过30块的总共有多少家?', 342 | '那个宁波市上个星期不是成交了有100000平米以下的吗,那宁波这个星期呢,成交的面积有多大呀', 343 | '那些售价高于1万每平的或者降价幅度在10%以上的楼盘有得什么销售名次吗', 344 | '单周票房超过1亿或者上映天数大于10天或者口碑指数大于6的电影有多少部', 345 | '有几部电影的单周票房超过了1亿或者上映天数大于10天或者口碑指数大于6的', 346 | '你知道单周票房超过1亿或者上映天数大于10天或者口碑指数大于6的电影名称有几个吗', 347 | '市值大于32万或者股份大于100手的公司有哪些', 348 | '你知道那些市值高于32万或者股份高于100手的公司名称吗', 349 | '新湖中宝和建发的涨幅分别是多少啊', 350 | '诶,你帮我查一下那个新湖中宝和建发他们的涨的一个幅度吧', 351 | '所有招5人以上的职位中,哪些对专业不作要求?', 352 | '什么岗位的最低学历要求为大专,招聘人数还少于3人?', 353 | '所有96年十二月通过的项目中,哪些级别是南安市市级的项目?', 354 | '在广西桂林师范大学出版社在2011年出版的题名有哪些呀?其作者是谁呢?', 355 | '麻烦看看,2011年在广西桂林师范大学出版社出版的有哪些题名,这当中作者是谁?', 356 | '麻烦问一下,都有哪些题名在2011年广西桂林师范大学出版社出版的?这作者都有谁啊?', 357 | '你好,我想知道目前有哪些专业是4年制的,还有每年学费四千的', 358 | '诶你知道学费四千一年,而且还是4年制的是哪些专业吗', 359 | '学费超过6000元的而且学制是4年的有哪些专业课程呢?', 360 | '请问都有哪些专业课程是4年制的并且学费是超过6000的?', 361 | '哪些企业的频炉产能超过了40万吨或者有2个中工频炉且每个炉有20吨', 362 | '有2个20吨的中工频炉或者产能在40万吨以上的企业有哪些', 363 | '那把那些有2个20吨中工频炉或者产能超过40万吨的公司名称告诉我一下', 364 | '所有统计报关单数比4000多的企业中,哪些是A类?', 365 | '你能帮我查查10年有几座城市的土地成交面积破了千万平吗?', 366 | '你知道什么地方在这个星期成交新房面积大于100000平米,套数超过100的吗', 367 | '去年同期有没有去化时间超过1年的1线城市啊,都是什么城市', 368 | '11年和12年累计土地成交超过1000万平的城市有哪些', 369 | '我想在2011-2012年土地成交量超过1000万平的城市选房,能不能帮我看看哪些城市符合条件', 370 | '上周末库存去化周期超过1年或者库存去化周期环比超过08的城市有多少', 371 | '2016年销量大于4800并且销售量为市场总量的90%以上,这是哪几款机器人啊', 372 | '2011年每股盈余在两毛以上的公司共有多少家' 373 | 374 | ]) 375 | cnt = 0 376 | if mode == 'write': 377 | f_h = open(file_path, 'w') 378 | for d in train_data: 379 | question = d['question'] 380 | if question in unwanted: continue 381 | conds = d['sql']['conds'] 382 | types = table_types[d['table_id']] 383 | header = table_headers[d['table_id']] 384 | question = trans_question_acc(question) # 转化 385 | # all cond val is not 'real' 386 | type_set = set([types[cond[0]] for cond in conds ]) 387 | if question in unwanted: continue 388 | good = True 389 | # 不能出现标注重叠 390 | mark_list = [0] * len(question) 391 | for cond in conds: 392 | if types[cond[0]] == 'real': # 如果是数字的话,通过另外的方法判断 393 | find_cnt, num_start_idx, num_end_idx = check_num_exactly_match_zero_case(cond[2], question) 394 | 395 | if find_cnt == 1 and max(mark_list[num_start_idx:num_end_idx+1]) > 0: 396 | good = False 397 | break 398 | if find_cnt == 1: 399 | mark_list[num_start_idx:num_end_idx+1] = [1] * (num_end_idx + 1 - num_start_idx) 400 | if find_cnt > 1: 401 | good = False 402 | if find_cnt == 0: 403 | val = most_similar_2(cond[2], question) 404 | if not val: 405 | good = False 406 | break 407 | if max(mark_list[question.index(val): question.index(val) + len(val)]) > 0: 408 | good = False 409 | break 410 | mark_list[question.index(val): question.index(val) + len(val)] = [1] * len(val) 411 | else: # 文本 412 | val = most_similar_2(cond[2], question) 413 | if not val: 414 | good = False 415 | break 416 | if max(mark_list[question.index(val): question.index(val) + len(val)]) > 0: good = False; break 417 | mark_list[question.index(val): question.index(val) + len(val)] = [1] * len(val) 418 | if good == True: 419 | cnt += 1 420 | for cond in conds: 421 | if types[cond[0]] == 'real': # 如果是数字的话,通过另外的方法判断 422 | find_cnt, num_start_idx, num_end_idx = check_num_exactly_match_zero_case(cond[2], question) 423 | if find_cnt == 0: 424 | val = most_similar_2(cond[2], question) 425 | else: 426 | val = question[num_start_idx: num_end_idx + 1] 427 | else: # 文本 428 | val = most_similar_2(cond[2], question) 429 | d_s.add(question + '\n') 430 | f_h.writelines(list(d_s)) 431 | elif mode == 'read': 432 | f_h = open(file_path, 'r') 433 | for line in f_h.readlines(): 434 | d_s.add(line[:-1]) 435 | return d_s 436 | else: 437 | raise ValueError('unsupported mode ') 438 | 439 | if not os.path.exists(q_text_contain_similar_path): 440 | q_text_contain_similar(q_text_contain_similar_path, 441 | mode='write', unwanted=wrong_mark_official|correct_q_set 442 | |no_num_similar_set| q_one_vs_more_col_set|q_need_exactly_match_set| 443 | q_need_exactly_match_more_strinct_set) 444 | q_text_contain_similar_set = q_text_contain_similar(q_text_contain_similar_path, 445 | mode='read', unwanted=wrong_mark_official|correct_q_set 446 | |no_num_similar_set| q_one_vs_more_col_set|q_need_exactly_match_set| 447 | q_need_exactly_match_more_strinct_set) 448 | 449 | assert len(q_text_contain_similar_set) == 1222 450 | 451 | 452 | def q_need_col_similar(file_path, mode='write', unwanted=set([])): 453 | """ 454 | 需要对列做similar来 最后根据位置而不是值来标记 455 | 这里只管带数字的 456 | """ 457 | d_s = set([]) 458 | unwanted = unwanted | set([ 459 | 'A股房地产股的最新市值是多少,它的最新股价是大于10块而且本周涨幅前10大于10%的', 460 | '我可以通过A股房地产股最新股价大于10块而且本周涨幅前10大于10%查询它的最新市值吗' 461 | ]) 462 | cnt = 0 463 | if mode == 'write': 464 | f_h = open(file_path, 'w') 465 | for d in train_data: 466 | question = d['question'] 467 | if question in unwanted: continue 468 | conds = d['sql']['conds'] 469 | types = table_types[d['table_id']] 470 | header = table_headers[d['table_id']] 471 | question = trans_question_acc(question) # 转化 472 | 473 | type_set = set([types[cond[0]] for cond in conds ]) 474 | if question in unwanted: continue 475 | if 'text' in type_set: continue 476 | good = True 477 | mark_pos = [0] * len(question) 478 | cond_set = list(set([cond[2] for cond in conds])) 479 | if len(cond_set) == 1 and check_num_exactly_match(cond_set[0], question)[0] < len(conds): 480 | pass 481 | for cond in conds: 482 | header_name = header[cond[0]] 483 | header_sim = most_similar_2(header_name, question) 484 | if not header_sim: good = False; break 485 | start_idx, end_idx, match_val = alap_an_cn_mark(question, header_name, cond[2]) 486 | if not match_val or match_val != cond[2] : good = False; break 487 | if max(mark_pos[start_idx:end_idx]) > 0: good = False; break 488 | mark_pos[start_idx: end_idx] = [1] * len(match_val) 489 | if good == True: 490 | cnt+= 1 491 | # 正确的取数口径 492 | for cond in conds: 493 | header_name = header[cond[0]] 494 | header_sim = most_similar_2(header_name, question) 495 | # 如果是real才需要下面这种,文本的话,直接most_similar !! 496 | start_idx, end_idx, match_val = alap_an_cn_mark(question, header_name, cond[2]) 497 | d_s.add(question + '\n') 498 | f_h.writelines(list(d_s)) 499 | elif mode == 'read': 500 | f_h = open(file_path, 'r') 501 | for line in f_h.readlines(): 502 | d_s.add(line[:-1]) 503 | return d_s | get_val_by_pos_hand_set 504 | else: 505 | raise ValueError('unsupported mode ') 506 | 507 | if not os.path.exists(q_need_col_similar_path): 508 | q_need_col_similar(q_need_col_similar_path, mode='write', unwanted=wrong_mark_official|correct_q_set| 509 | no_num_similar_set| q_one_vs_more_col_set|q_need_exactly_match_set| 510 | q_need_exactly_match_more_strinct_set|q_text_contain_similar_set) 511 | 512 | q_need_col_similar_set = q_need_col_similar(q_need_col_similar_path, mode='read', unwanted=wrong_mark_official|correct_q_set| 513 | no_num_similar_set| q_one_vs_more_col_set|q_need_exactly_match_set| 514 | q_need_exactly_match_more_strinct_set|q_text_contain_similar_set) 515 | assert len(q_need_col_similar_set) == 1468 516 | 517 | def check_other(): 518 | cnt = 0 519 | for d in train_data: 520 | question = d['question'] 521 | conds = d['sql']['conds'] 522 | types = table_types[d['table_id']] 523 | header = table_headers[d['table_id']] 524 | question = trans_question_acc(question) 525 | if question in bad_question|wrong_mark_official|correct_q_set|\ 526 | no_num_similar_set| q_one_vs_more_col_set|q_need_exactly_match_set|\ 527 | q_need_exactly_match_more_strinct_set|q_text_contain_similar_set|q_need_col_similar_set: 528 | continue 529 | 530 | cnt += 1 531 | print(question) 532 | print(conds) 533 | print(cnt) 534 | 535 | if __name__ == "__main__": 536 | check_other() 537 | -------------------------------------------------------------------------------- /code/nl2sql_main.py: -------------------------------------------------------------------------------- 1 | #! -*- coding: utf-8 -*- 2 | import json 3 | import os 4 | import sys 5 | os.environ['PYTHONHASHSEED'] = '0' 6 | import numpy as np 7 | import tensorflow as tf 8 | 9 | from keras_bert import load_trained_model_from_checkpoint, Tokenizer 10 | from keras.layers import * 11 | from keras.models import Model 12 | import keras.backend as K 13 | from keras.optimizers import Adam 14 | from keras.callbacks import Callback 15 | from tqdm import tqdm 16 | import codecs 17 | import jieba 18 | import editdistance 19 | import re 20 | import numpy as np 21 | from dbengine import DBEngine 22 | from calc_acc import * 23 | from check_input_feature import * 24 | from post_treat import * 25 | from new_mark_acc_ensure import * 26 | from question_prepro import * 27 | from utils import read_data 28 | import argparse 29 | from config import config 30 | parser = argparse.ArgumentParser() 31 | parser.add_argument('--mode', type=str, default='', help='execute mode, eg: train/test/evaluate') 32 | args = parser.parse_args() 33 | if args.mode not in set(['train', 'test', 'evaluate']): 34 | raise ValueError('Please input correct execute mode') 35 | mode = args.mode 36 | 37 | maxlen = 160 38 | num_agg = 7 # agg_sql_dict = {0:"", 1:"AVG", 2:"MAX", 3:"MIN", 4:"COUNT", 5:"SUM", 6:"不被select"} 39 | num_op = 5 # {0:">", 1:"<", 2:"==", 3:"!=", 4:"不被select"} 40 | num_cond_conn_op = 3 # conn_sql_dict = {0:"", 1:"and", 2:"or"} 41 | csel_num = 20 # col cnt 最大为20 42 | 43 | # learning_rate = 5e-5 44 | learning_rate = 15e-5 # 8 is Ok and testing 15 45 | min_learning_rate = 1e-5 46 | 47 | config_path = os.path.join(model_bert_wwm_path, 'chinese-bert_chinese_wwm_L-12_H-768_A-12/bert_config.json') 48 | checkpoint_path = os.path.join(model_bert_wwm_path, 'chinese-bert_chinese_wwm_L-12_H-768_A-12/bert_model.ckpt') 49 | dict_path = os.path.join(model_bert_wwm_path, 'chinese-bert_chinese_wwm_L-12_H-768_A-12/vocab.txt') 50 | weight_save_path = os.path.join(model_path, 'weights/nl2sql_finetune.weights') 51 | 52 | if mode != 'test': 53 | train_data, train_tables = read_data( 54 | os.path.join(train_data_path, 'train.json'), 55 | os.path.join(train_data_path, 'train.tables.json') 56 | ) # 41522 5013 57 | 58 | 59 | valid_data, valid_tables = read_data( 60 | os.path.join(valid_data_path, 'val.json'), 61 | os.path.join(valid_data_path, 'val.tables.json') 62 | ) # 4396 1197 63 | test_data, test_tables = read_data( 64 | os.path.join(test_file_path, 'final_test.json'), 65 | os.path.join(test_file_path, 'final_test.tables.json') 66 | ) 67 | 68 | token_dict = {} 69 | with codecs.open(dict_path, 'r', 'utf8') as reader: 70 | for line in reader: 71 | token = line.strip() 72 | token_dict[token] = len(token_dict) 73 | 74 | class OurTokenizer(Tokenizer): 75 | def _tokenize(self, text): 76 | R = [] 77 | for c in text: 78 | if c in self._token_dict: 79 | R.append(c) 80 | elif self._is_space(c): 81 | R.append('[unused1]') 82 | else: 83 | R.append('[UNK]') 84 | return R 85 | 86 | tokenizer = OurTokenizer(token_dict) 87 | 88 | 89 | def seq_padding(X, padding=0, maxlen=None): 90 | if maxlen is None: 91 | L = [len(x) for x in X] 92 | ML = max(L) 93 | else: 94 | ML = maxlen 95 | return np.array([ 96 | np.concatenate([x[:ML], [padding] * (ML - len(x))]) if len(x[:ML]) < ML else x for x in X 97 | ]) 98 | 99 | 100 | class data_generator: 101 | 102 | def __init__(self, data, tables, batch_size=32): # 32 to 256 for cpu , 32 for gpu 103 | self.data = data 104 | self.tables = tables 105 | self.batch_size = batch_size 106 | self.steps = len(self.data) // self.batch_size 107 | if len(self.data) % self.batch_size != 0: 108 | self.steps += 1 109 | 110 | 111 | def __len__(self): 112 | return self.steps 113 | 114 | def __iter__(self): 115 | while True: 116 | if PY2: 117 | idxs = range(len(self.data)) 118 | elif PY3: 119 | idxs = [x for x in range(len(self.data))] 120 | np.random.shuffle(idxs) 121 | X1, X2, XM, H, HM, SEL, CONN, CSEL0, COP = [], [], [], [], [], [], [], [], [] 122 | CSEL1, CSEL2 = [], [] 123 | CDIV = [] 124 | 125 | for i in idxs: 126 | d = self.data[i] 127 | ori_q = d['question'] 128 | d['question'] = trans_question_acc(d['question']) 129 | t = self.tables[d['table_id']]['headers'] 130 | dtypes = self.tables[d['table_id']]['types'] 131 | x1, x2 = tokenizer.encode(d['question']) 132 | xm = [0] + [1] * len(d['question']) + [0] 133 | h = [] 134 | for j in t: 135 | _x1, _x2 = tokenizer.encode(j) 136 | h.append(len(x1)) 137 | x1.extend(_x1) 138 | x2.extend(_x2) 139 | hm = [1] * len(h) 140 | sel = [] 141 | for j in range(len(h)): 142 | if j in d['sql']['sel']: 143 | j = d['sql']['sel'].index(j) 144 | sel.append(d['sql']['agg'][j]) 145 | else: 146 | sel.append(num_agg - 1) 147 | conn = [d['sql']['cond_conn_op']] 148 | csel0 = np.zeros(len(d['question']) + 2, dtype='int32') 149 | csel1 = np.zeros(len(d['question']) + 2, dtype='int32') 150 | csel2 = np.zeros(len(d['question']) + 2, dtype='int32') 151 | cop = np.zeros(len(d['question']) + 2, dtype='int32') + num_op - 1 152 | cdiv = np.zeros(len(d['question']) + 2, dtype='int32') 153 | is_wrong_q = False 154 | for cond in d['sql']['conds']: 155 | if d['question'] in correct_q_set: 156 | if dtypes[cond[0]] == 'real': 157 | _, start_pos, end_pos = check_num_exactly_match(cond[2], d['question']) 158 | 159 | csel0[start_pos + 1: end_pos + 1 + 1] = cond[0] + 1 160 | cop[start_pos + 1: end_pos + 1 + 1] = cond[1] 161 | else: 162 | start_pos = d['question'].index(cond[2]) if cond[2] in d['question'] else \ 163 | d['question'].index(most_similar_2(cond[2], d['question'])) 164 | # print(start_pos, start_pos + len(cond[2]), d['question'][start_pos: start_pos + len(cond[2])]) 165 | csel0[start_pos + 1: start_pos + 1 + len(cond[2])] = cond[0] + 1 166 | cop[start_pos + 1: start_pos + 1 + len(cond[2])] = cond[1] 167 | 168 | elif d['question'] in no_num_similar_set: 169 | # print('cond val is{}'.format(cond[2])) 170 | # print('cond val is {}, q is {} and sim is {}'.format(cond[2], most_similar_2(cond[2], d['question']))) 171 | 172 | sim = cond[2] if cond[2] in d['question'] else most_similar_2(cond[2], d['question']) 173 | start_pos = d['question'].index(sim) 174 | # print(d['question']) 175 | # print(start_pos, start_pos + len(sim), d['question'][start_pos: start_pos + len(sim)]) 176 | csel0[start_pos + 1: start_pos + len(sim) + 1] = cond[0] + 1 177 | cop[start_pos + 1: start_pos + len(sim) + 1] = cond[1] 178 | elif d['question'] in q_one_vs_more_col_set: 179 | # print(d['question']) 180 | if check_num_exactly_match(cond[2], d['question'])[0] == 1: 181 | _, start_pos, end_pos = check_num_exactly_match(cond[2], d['question']) 182 | elif check_num_exactly_match_zero_case(cond[2], d['question'])[0] == 1: 183 | _, start_pos, end_pos = check_num_exactly_match_zero_case(cond[2], d['question']) 184 | else: 185 | raise ValueError('value error') 186 | if max(csel0[start_pos + 1: end_pos + 1 + 1]) != 0: 187 | if max(csel1[start_pos + 1: end_pos + 1 + 1]) != 0: 188 | csel2[start_pos + 1: end_pos + 1 + 1] = cond[0] + 1 189 | else: 190 | csel1[start_pos + 1: end_pos + 1 + 1] = cond[0] + 1 191 | else: 192 | csel0[start_pos + 1: end_pos + 1 + 1] = cond[0] + 1 193 | 194 | cop[start_pos + 1: end_pos + 1 + 1] = cond[1] 195 | 196 | # print(start_pos, end_pos, d['question'][start_pos: end_pos + 1]) 197 | 198 | elif d['question'] in q_need_exactly_match_set: 199 | _, start_pos, end_pos = check_num_exactly_match(cond[2], d['question']) 200 | # print(d['question']) 201 | # print(start_pos, end_pos, d['question'][start_pos: end_pos + 1]) 202 | csel0[start_pos + 1: end_pos + 1 + 1] = cond[0] + 1 203 | cop[start_pos + 1: end_pos + 1 + 1] = cond[1] 204 | elif d['question'] in q_need_exactly_match_more_strinct_set: 205 | _, start_pos, end_pos = check_num_exactly_match_zero_case(cond[2], d['question']) 206 | # print(d['question']) 207 | # print(start_pos, end_pos, d['question'][start_pos: end_pos + 1]) 208 | csel0[start_pos + 1: end_pos + 1 + 1] = cond[0] + 1 209 | cop[start_pos + 1: end_pos + 1 + 1] = cond[1] 210 | 211 | elif d['question'] in q_text_contain_similar_set: 212 | if dtypes[cond[0]] == 'real': # 如果是数字的话,通过另外的方法判断 213 | # print(d['question']) 214 | find_cnt, start_pos, end_pos = check_num_exactly_match_zero_case(cond[2], d['question']) 215 | if find_cnt == 1: 216 | 217 | # print(start_pos, end_pos, d['question'][start_pos: end_pos + 1]) 218 | csel0[start_pos + 1: end_pos + 1 + 1] = cond[0] + 1 219 | cop[start_pos + 1: end_pos + 1 + 1] = cond[1] 220 | elif find_cnt == 0: 221 | val = most_similar_2(cond[2], d['question']) 222 | start_pos = d['question'].index(val) 223 | # print(start_pos, start_pos + len(sim), d['question'][start_pos: start_pos + len(sim)]) 224 | csel0[start_pos + 1: start_pos + len(val) + 1] = cond[0] + 1 225 | cop[start_pos + 1: start_pos + len(val) + 1] = cond[1] 226 | 227 | else: # 文本 228 | val = most_similar_2(cond[2], d['question']) 229 | start_pos = d['question'].index(val) 230 | # print(start_pos, start_pos + len(sim), d['question'][start_pos: start_pos + len(sim)]) 231 | csel0[start_pos + 1: start_pos + len(val) + 1] = cond[0] + 1 232 | cop[start_pos + 1: start_pos + len(val) + 1] = cond[1] 233 | 234 | elif d['question'] in q_need_col_similar_set: 235 | header_name = t[cond[0]] 236 | start_pos, end_pos, match_val = alap_an_cn_mark(d['question'], header_name, cond[2]) 237 | csel0[start_pos + 1: end_pos + 1] = cond[0] + 1 238 | cop[start_pos + 1: end_pos + 1] = cond[1] 239 | else: 240 | is_wrong_q = True 241 | ab = True 242 | if ab: 243 | for idx in range(1, len(csel0) - 1): 244 | if csel0[idx] != csel0[idx - 1] and csel0[idx - 1] != 0 and csel0[idx] != 0: 245 | # print(d['question']) 246 | cdiv[idx] = 1 247 | # print(cdiv) 248 | 249 | if len(x1) > maxlen or is_wrong_q : 250 | continue 251 | X1.append(x1) # bert的输入 252 | X2.append(x2) # bert的输入 253 | XM.append(xm) # 输入序列的mask 254 | H.append(h) # 列名所在位置 255 | HM.append(hm) # 列名mask 256 | SEL.append(sel) # 被select的列 257 | CONN.append(conn) # 连接类型 258 | CSEL0.append(csel0) # 条件中的列 259 | CSEL1.append(csel1) # 条件中的列 260 | CSEL2.append(csel2) # 条件中的列 261 | COP.append(cop) # 条件中的运算符(同时也是值的标记) 262 | CDIV.append(cdiv) # 263 | if len(X1) == self.batch_size: 264 | X1 = seq_padding(X1) 265 | X2 = seq_padding(X2) 266 | XM = seq_padding(XM, maxlen=X1.shape[1]) 267 | H = seq_padding(H) 268 | HM = seq_padding(HM) 269 | SEL = seq_padding(SEL) 270 | CONN = seq_padding(CONN) 271 | CSEL0 = seq_padding(CSEL0, maxlen=X1.shape[1]) 272 | CSEL1 = seq_padding(CSEL1, maxlen=X1.shape[1]) 273 | CSEL2 = seq_padding(CSEL2, maxlen=X1.shape[1]) 274 | CDIV = seq_padding(CDIV, maxlen=X1.shape[1]) 275 | 276 | COP = seq_padding(COP, maxlen=X1.shape[1]) 277 | yield [X1, X2, XM, H, HM, SEL, CONN, CSEL0, CSEL1, CSEL2, COP, CDIV], None 278 | X1, X2, XM, H, HM, SEL, CONN, CSEL0, COP = [], [], [], [], [], [], [], [], [] 279 | CSEL1, CSEL2 = [], [] 280 | CDIV = [] 281 | else: 282 | pass 283 | 284 | def seq_gather(x): 285 | """seq是[None, seq_len, s_size]的格式, 286 | idxs是[None, n]的格式,在seq的第i个序列中选出第idxs[i]个向量, 287 | 最终输出[None, n, s_size]的向量。 288 | 289 | seq_gather[x, h] 290 | """ 291 | seq, idxs = x 292 | idxs = K.cast(idxs, 'int32') # must int 32 293 | return K.tf.batch_gather(seq, idxs) 294 | 295 | 296 | train_D = data_generator(train_data, train_tables) #get Train data 297 | #valid_D = data_generator(valid_data, valid_tables) #get Train data 298 | 299 | bert_model = load_trained_model_from_checkpoint(config_path, checkpoint_path, seq_len=None) 300 | 301 | for l in bert_model.layers: 302 | l.trainable = True 303 | 304 | x1_in = Input(shape=(None,), dtype='int32') 305 | x2_in = Input(shape=(None,)) 306 | xm_in = Input(shape=(None,)) 307 | h_in = Input(shape=(None,), dtype='int32') 308 | hm_in = Input(shape=(None,)) 309 | sel_in = Input(shape=(None,), dtype='int32') 310 | conn_in = Input(shape=(1,), dtype='int32') 311 | csel0_in = Input(shape=(None,), dtype='int32') 312 | csel1_in = Input(shape=(None,), dtype='int32') 313 | csel2_in = Input(shape=(None,), dtype='int32') 314 | cop_in = Input(shape=(None,), dtype='int32') 315 | cdiv_in = Input(shape=(None,), dtype='int32') 316 | 317 | x1, x2, xm, h, hm, sel, conn, csel0, csel1, csel2, cop, cdiv = ( 318 | x1_in, x2_in, xm_in, h_in, hm_in, sel_in, conn_in, csel0_in, csel1_in, csel2_in, cop_in, cdiv_in 319 | ) 320 | 321 | hm = Lambda(lambda x: K.expand_dims(x, 1))(hm) # header的mask.shape=(None, 1, h_len) 322 | 323 | x = bert_model([x1_in, x2_in]) # shape x [?, ?, 768] [batch_size, n_step(n_input_step), hidden_size] 324 | x4conn = Lambda(lambda x: x[:, 0])(x) #x[:, 0] [None, hidden_size] 325 | pconn = Dense(num_cond_conn_op, activation='softmax')(x4conn) # [None, num_cond_conn_op] 326 | 327 | # h记录各个header[cls]所在的位置, 这个seq_gather的作用就是把input_x中的header[cls]搞出来。 328 | x4h = Lambda(seq_gather)([x, h]) # header [cls] is selected [batch_size, header_step, hidden_size] 329 | psel = Dense(num_agg, activation='softmax')(x4h) # [bs, header_step, num_agg] 330 | 331 | pcop = Dense(num_op, activation='softmax')(x) # [bs, q_step, num_op] 332 | 333 | x_ori = x 334 | x = Lambda(lambda x: K.expand_dims(x, 2))(x) # shape [batch_size, n_step, 1, hidden_size] 335 | x4h_ori = x4h 336 | x4h = Lambda(lambda x: K.expand_dims(x, 1))(x4h) # header cls selected in x4h [None, 1, header_n_step, hidden_size ] 337 | 338 | pcsel_1 = Dense(1)(x) # [None, q_n_step, 1 ,1] 339 | pcsel_2 = Dense(1)(x4h) # [None, 1, h_n_step, 1 ] 340 | pcsel_att = Lambda(lambda x: x[0] * x[1])([pcsel_1, pcsel_2]) # [None, q_n_step, h_n_step,1] 341 | pcsel_att = Lambda(lambda x: x[..., 0])(pcsel_att) # [None,q_n_step,h_n_step] 342 | #x4h_ori [None, h_n_step,hidden_size】 343 | pcsel_h_part = Lambda(lambda x: K.batch_dot(x[0], x[1]))([pcsel_att, x4h_ori]) # [None, q_n_step, hidden_siz] 344 | pcsel = concatenate([x_ori, pcsel_h_part], axis=-1) 345 | 346 | pcsel = Dense(1200, activation='relu')(pcsel) #[None, q_n_step, 1200] 347 | pcdiv = Dense(2, activation='softmax')(pcsel) 348 | 349 | pcsel0 = Dense(csel_num, activation='softmax')(pcsel) # [bs, q_step, 3, num_op] 350 | pcsel1 = Dense(csel_num, activation='softmax')(pcsel) # [bs, q_step, 3, num_op] 351 | pcsel2 = Dense(csel_num, activation='softmax')(pcsel) # [bs, q_step, 3, num_op] 352 | 353 | # Model的参数 def __init__(self, inputs, outputs, name=None): 354 | model = Model( 355 | [x1_in, x2_in, h_in, hm_in], # inputs 356 | [psel, pconn, pcop, pcsel0, pcsel1, pcsel2, pcdiv] # outputs 357 | ) 358 | 359 | train_model = Model( 360 | [x1_in, x2_in, xm_in, h_in, hm_in, sel_in, conn_in, csel0_in, csel1_in, csel2_in, cop_in, cdiv_in], 361 | [psel, pconn, pcop, pcsel0, pcsel1, pcsel2, pcdiv] 362 | ) 363 | 364 | 365 | xm = xm # question的mask.shape=(None, x_len) 366 | 367 | hm = hm[:, 0] # header的mask.shape=(None, h_len) # 这个操作就是去掉1,torch中有squeeze压紧方法做这个事情 368 | 369 | # condition mask, [1, 0, 1, 1,1 ] 如果元素为1,说明当前位置的op不是空操作 370 | cm = K.cast(K.not_equal(cop, num_op - 1), 'float32') # conds的mask.shape=(None, x_len) 371 | 372 | # 注意hm & xm 用在啥地方了 373 | 374 | ''' 375 | 例子1: 376 | 以psel_loss = K.sum(psel_loss * hm) / K.sum(hm) 为例介绍这里的hm的用处. 377 | 首先 hm作为header mask, 里面存储的都是header[cls]的位置 378 | hm的shape为[bs, header_cnt], header_cnt这个维度里面的值有一些padding的0 379 | psel_loss 的shape为 [bs, header_cnt] ? 380 | psel_loss * hm 的shape为 [bs, header_cnt] 相乘之后即只关注有效header的损失,那些padding出来的不要加入损失计算 381 | k.sum(psel_loss * hm) keras.backend中的sum和普通的sum不同,他会将矩阵中的所有值相加,最后结果为一个值 382 | 383 | 几乎所有参数都是带有batch_size维度的,因为计算损失是在整个batch上计算的 384 | ''' 385 | psel_loss = K.sparse_categorical_crossentropy(sel_in, psel) 386 | psel_loss = K.sum(psel_loss * hm) / K.sum(hm) # case: test10 padding位置的header不纳入损失计算 387 | pconn_loss = K.sparse_categorical_crossentropy(conn_in, pconn) 388 | pconn_loss = K.mean(pconn_loss) # 取均值,是为了算在整个batch中的损失 389 | pcop_loss = K.sparse_categorical_crossentropy(cop_in, pcop) 390 | pcop_loss = K.sum(pcop_loss * xm) / K.sum(xm) 391 | 392 | pcsel0_loss = K.sparse_categorical_crossentropy(csel0_in, pcsel0) 393 | pcsel0_loss = K.sum(pcsel0_loss * xm * cm) / K.sum(xm * cm) 394 | 395 | pcsel1_loss = K.sparse_categorical_crossentropy(csel1_in, pcsel1) 396 | pcsel1_loss = K.sum(pcsel1_loss * xm * cm) / K.sum(xm * cm) 397 | 398 | 399 | pcsel2_loss = K.sparse_categorical_crossentropy(csel2_in, pcsel2) 400 | pcsel2_loss = K.sum(pcsel2_loss * xm * cm) / K.sum(xm * cm) 401 | 402 | pcdiv_loss = K.sparse_categorical_crossentropy(cdiv_in, pcdiv) 403 | pcdiv_loss = K.sum(pcdiv_loss * xm * cm) / K.sum(xm * cm) 404 | 405 | loss = psel_loss + pconn_loss + pcop_loss + pcsel0_loss + pcsel1_loss + pcsel2_loss + pcdiv_loss 406 | 407 | train_model.add_loss(loss) 408 | train_model.compile(optimizer=Adam(learning_rate)) 409 | train_model.summary() 410 | # model.load_weights(weight_save_path) # 411 | except_tr_cnt = 0 412 | 413 | 414 | def nl2sql(question, table): 415 | """输入question和headers,转SQL 416 | """ 417 | try: 418 | question = trans_question_acc(question) 419 | question = trans_question_short_year(question) 420 | question = question.replace('负数', '小于0') 421 | question = question.replace('负值', '小于0') 422 | question = question.replace('为负', '小于0') 423 | question = question.replace('正数', '大于0') 424 | question = question.replace('正值', '大于0') 425 | question = question.replace('为正', '大于0') 426 | question = question.replace('没什么要求', '不限') 427 | question = question.replace('没要求', '不限') 428 | except: 429 | pass 430 | x1, x2 = tokenizer.encode(question) 431 | h = [] 432 | for i in table['headers']: 433 | _x1, _x2 = tokenizer.encode(i) 434 | # h这里记录了每个header的[cls]所在位置 435 | h.append(len(x1)) 436 | x1.extend(_x1) 437 | x2.extend(_x2) 438 | hm = [1] * len(h) # hm为header在[cls]位置的mask, hm的长度,正好是header的个数,当然header的个数和[cls]的个数是一致的 439 | 440 | psel, pconn, pcop, pcsel0, pcsel1, pcsel2, pcdiv = model.predict([ 441 | np.array([x1]), 442 | np.array([x2]), 443 | np.array([h]), 444 | np.array([hm]) 445 | ]) 446 | pcsel_ori = pcsel 447 | 448 | R = {'agg': [], 'sel': []} 449 | # psel是对header的[CLS]位置做处理的出来的,各个header的聚合或者是否被select的概率。 450 | # psel shape [1, 9, 7] => [None, header_col_cnt, op] 451 | for i, j in enumerate(psel[0].argmax(1)): 452 | if j != num_agg - 1: # num_agg-1类是不被select的意思 453 | # 7中状态拆分成下面两种,1种是是否被选择,另外一种是agg operation 454 | R['sel'].append(i) 455 | R['agg'].append(j) 456 | conds = [] 457 | v_op = -1 458 | 459 | # pcop: shape [bs, seq_len(n_step), num_op] 下面截取了:len(question) + 1 460 | # 截取之后shape: [bs, question_len] 461 | # 在这里的bs=1, 貌似是对每一个样例做的处理. 462 | # pcop (1, 103, 5) => [None, question+header_len, op_len] 463 | # 这里的pcop的第二个维度为105 464 | # 105 = 32(question len) + 2(question cls&sep)+ 53(all header col len) +18(header cls+sep,total 9 column in table) 465 | # 下面取的时候只取了 [0:33] 466 | 467 | unit_first_list = [] 468 | unit_second_list = [] 469 | for i, j in enumerate(pcop[0, :len(question) + 1].argmax(1)): #[,,op_cnt] 470 | # 这里结合标注和分类来预测条件 471 | if i == 0: continue # start 0 is of no use 472 | if j != num_op - 1: # num_op: {0:">", 1:"<", 2:"==", 3:"!=", 4:"不被select"} 473 | if v_op != j: 474 | if v_op != -1: 475 | v_end = v_start + len(v_str) 476 | v_start_idx, v_end_idx, smooth_val = smooth_numeric(v_start - 1, v_end - 1, question) 477 | unit_first, unit_second = get_append_unit(v_start - 1, v_end - 1, question) # unit_firt: 亿 unit_second: 元 478 | # 添加div中的信息 479 | # print(max(pcdiv[0][v_start: v_end].argmax(1))) 480 | if max(pcdiv[0][v_start: v_end].argmax(1)) > 0:# 0 481 | if 1 in pcdiv[0][v_start: v_end].argmax(1): 482 | 483 | entity_start_pos_list = [v_start + 1 + idx for idx, mark in enumerate(pcdiv[0][v_start + 1: v_end].argmax(1)) if mark == 1] 484 | if len(entity_start_pos_list) > 0 and entity_start_pos_list[0] != v_start: 485 | entity_start_pos_list.insert(0, v_start) 486 | if len(entity_start_pos_list) > 0 and entity_start_pos_list[-1] != v_end: 487 | entity_start_pos_list.append(v_end) 488 | 489 | for idx in range(len(entity_start_pos_list) - 1): 490 | new_s = entity_start_pos_list[idx] 491 | new_e = entity_start_pos_list[idx + 1] 492 | csel = pcsel0[0][new_s: new_e].mean(0).argmax() - 1 493 | v_str1 = question[new_s - 1: new_e - 1] 494 | if v_str1 is not None and csel >= 0: 495 | 496 | unit_first_list.append(unit_first) 497 | unit_second_list.append(unit_second) 498 | conds.append((csel, v_op, v_str1)) 499 | else: 500 | csel = pcsel0[0][v_start: v_end].mean(0).argmax() - 1 501 | 502 | if v_str is not None: 503 | v_str = smooth_val 504 | unit_first_list.append(unit_first) 505 | unit_second_list.append(unit_second) 506 | conds.append((csel, v_op, v_str)) 507 | if pcsel1[0][v_start: v_end].mean(0).argmax() - 1 >= 0: # add 508 | csel = pcsel1[0][v_start: v_end].mean(0).argmax() - 1 509 | if csel >= 0: 510 | if v_str is not None: 511 | v_str = smooth_val 512 | unit_first_list.append(unit_first) 513 | unit_second_list.append(unit_second) 514 | conds.append((csel, v_op, v_str)) 515 | 516 | if pcsel2[0][v_start: v_end].mean(0).argmax() - 1 > 0: # add 517 | csel = pcsel2[0][v_start: v_end].mean(0).argmax() - 1 518 | if v_str is not None: 519 | v_str = smooth_val 520 | unit_first_list.append(unit_first) 521 | unit_second_list.append(unit_second) 522 | conds.append((csel, v_op, v_str)) 523 | v_start = i 524 | v_op = j # v_op在这里第一次赋值 525 | v_str = question[i - 1] # v_str在这里第一次赋值 526 | else: # 在 这里 j == num_op-1,说明当前运算符在question上延续着 527 | v_str += question[i - 1] 528 | if i == len(question): 529 | v_end = v_start + len(v_str) 530 | 531 | v_start_idx, v_end_idx, smooth_val = smooth_numeric(v_start - 1, v_end - 1, question) 532 | unit_first, unit_second = get_append_unit(v_start - 1, v_end - 1, question) # unit_firt: 亿 unit_second: 元 533 | # 添加div中的信息 534 | # print(max(pcdiv[0][v_start: v_end].argmax(1))) 535 | if max(pcdiv[0][v_start: v_end].argmax(1)) > 0:# 0 536 | if 1 in pcdiv[0][v_start: v_end].argmax(1): 537 | 538 | entity_start_pos_list = [v_start + 1 + idx for idx, mark in enumerate(pcdiv[0][v_start + 1: v_end].argmax(1)) if mark == 1] 539 | if len(entity_start_pos_list) > 0 and entity_start_pos_list[0] != v_start: 540 | entity_start_pos_list.insert(0, v_start) 541 | if len(entity_start_pos_list) > 0 and entity_start_pos_list[-1] != v_end: 542 | entity_start_pos_list.append(v_end) 543 | 544 | for idx in range(len(entity_start_pos_list) - 1): 545 | new_s = entity_start_pos_list[idx] 546 | new_e = entity_start_pos_list[idx + 1] 547 | csel = pcsel0[0][new_s: new_e].mean(0).argmax() - 1 548 | v_str1 = question[new_s - 1: new_e - 1] 549 | 550 | if v_str1 is not None and csel >= 0: 551 | 552 | unit_first_list.append(unit_first) 553 | unit_second_list.append(unit_second) 554 | conds.append((csel, v_op, v_str1)) 555 | else: 556 | if pcsel1[0][v_start: v_end].mean(0).argmax() - 1 >= 0: # add 557 | csel = pcsel1[0][v_start: v_end].mean(0).argmax() - 1 558 | if csel >= 0: 559 | if v_str is not None: 560 | v_str = smooth_val 561 | unit_first_list.append(unit_first) 562 | unit_second_list.append(unit_second) 563 | conds.append((csel, v_op, v_str)) 564 | 565 | if pcsel2[0][v_start: v_end].mean(0).argmax() - 1 >= 0: # add 566 | csel = pcsel2[0][v_start: v_end].mean(0).argmax() - 1 567 | if v_str is not None: 568 | v_str = smooth_val 569 | unit_first_list.append(unit_first) 570 | unit_second_list.append(unit_second) 571 | conds.append((csel, v_op, v_str)) 572 | 573 | csel = pcsel0[0][v_start: v_end].mean(0).argmax() - 1 574 | if v_str is not None: 575 | v_str = smooth_val 576 | unit_first_list.append(unit_first) 577 | unit_second_list.append(unit_second) 578 | conds.append((csel, v_op, v_str)) 579 | break 580 | elif v_op != -1: # 遇到了"not selected" 了 581 | v_end = v_start + len(v_str) 582 | # pcsel (1, 105, 9) => (None, q_len+h_len, col_cnt ) 583 | # 第二个维度为105, 105 = 32(question len)+2(question cls&sep)+ 53(all header col len) +18(header cls+sep,total 9 column in table 584 | # pcsel的作用是定位question中的每个字段对应header中的哪个列,所以最后一维为9,当前测试样例的表有9列 585 | v_start_idx, v_end_idx, smooth_val = smooth_numeric(v_start - 1, v_end - 1, question) 586 | unit_first, unit_second = get_append_unit(v_start - 1, v_end - 1, question) # unit_firt: 亿 unit_second: 元 587 | if max(pcdiv[0][v_start: v_end].argmax(1)) > 0: 588 | if 1 in pcdiv[0][v_start: v_end].argmax(1) and pcdiv[0][v_start].argmax() != 1 : 589 | 590 | entity_start_pos_list = [v_start + 1 + idx for idx, mark in enumerate(pcdiv[0][v_start + 1: v_end].argmax(1)) if mark == 1] 591 | if entity_start_pos_list[0] != v_start: 592 | entity_start_pos_list.insert(0, v_start) 593 | if entity_start_pos_list[-1] != v_end: 594 | entity_start_pos_list.append(v_end) 595 | 596 | for idx in range(len(entity_start_pos_list) - 1): 597 | new_s = entity_start_pos_list[idx] 598 | new_e = entity_start_pos_list[idx + 1] 599 | 600 | csel = pcsel0[0][new_s: new_e].mean(0).argmax() - 1 601 | v_str1 = question[new_s - 1: new_e - 1] 602 | if v_str1 is not None and csel >= 0: 603 | 604 | unit_first_list.append(unit_first) 605 | unit_second_list.append(unit_second) 606 | conds.append((csel, v_op, v_str1)) 607 | else: 608 | 609 | csel = pcsel0[0][v_start: v_end].mean(0).argmax() - 1 610 | v_e = v_end - 1 611 | untreat_unit = '' 612 | if v_e < len(question) and len(re.findall(regex_tail, question[v_e])) > 0: 613 | untreat_unit = re.findall(regex_tail, question[v_e])[0] 614 | if v_e + 1 < len(question) and len(re.findall(regex_tail, question[v_e + 1])) > 0: 615 | untreat_unit += re.findall(regex_tail, question[v_e + 1])[0] 616 | if v_str is not None: 617 | v_str = smooth_val 618 | unit_first_list.append(unit_first) 619 | unit_second_list.append(unit_second) 620 | conds.append((csel, v_op, v_str)) 621 | 622 | if pcsel1[0][v_start: v_end].mean(0).argmax() - 1 >= 0: # add 623 | csel = pcsel1[0][v_start: v_end].mean(0).argmax() - 1 624 | if csel >= 0: 625 | if v_str is not None: 626 | v_str = smooth_val 627 | unit_first_list.append(unit_first) 628 | unit_second_list.append(unit_second) 629 | conds.append((csel, v_op, v_str)) 630 | 631 | if pcsel2[0][v_start: v_end].mean(0).argmax() - 1 >= 0: # add 632 | csel = pcsel2[0][v_start: v_end].mean(0).argmax() - 1 633 | if v_str is not None: 634 | v_str = smooth_val 635 | unit_first_list.append(unit_first) 636 | unit_second_list.append(unit_second) 637 | conds.append((csel, v_op, v_str)) 638 | v_op = -1 639 | R['conds'] = set() # 集合自己去重 640 | idx = 0 641 | for i, j, k in conds: 642 | if re.findall('[^\d\-\.\%]', k): # 找到非数字 643 | j = 2 # 非数字只能用等号,, 644 | if j == 2 : # 这里判定出条件运算符是等号哦 等号也有可能是数字的 645 | ori_k = k 646 | if k not in table['all_values']: 647 | k = most_similar_new(k, list(table['all_values'])) 648 | if k is None: continue 649 | idx_except = False 650 | try: 651 | h = table['headers'][i] 652 | except: 653 | h = table['headers'][0] 654 | # 然后检查值对应的列是否正确,如果不正确,直接修正列名 655 | if k not in table['content'][h]: # 发现标记出来的值不在预测出来所属的列不一致。 656 | for r, v in table['content'].items(): 657 | if k in v: 658 | i = table['header2id'][r] 659 | break 660 | unit_first = None if unit_first_list[idx] == '' else unit_first_list[idx] 661 | unit_second = None if unit_second_list[idx] == '' else unit_second_list[idx] 662 | idx += 1 663 | if k.isnumeric() and i <= len(table['headers']) - 1: ## 需要改 不要用 isnumeric() 并要处理百分号 664 | # 添加一个预处理,预测的数字左右缺失的话 665 | ori_k = k 666 | try: 667 | k = number_trans(int(k), table['headers'][i], table['title'], format_of_number=unit_first, format_desc=unit_second) 668 | max_col_val = None 669 | have_text_in_col = False 670 | for col_val in table['content'][table['headers'][i]]: 671 | if not re.findall('[^\d\.]', str(col_val)): 672 | if max_col_val is None: 673 | max_col_val = float(col_val) 674 | else: 675 | max_col_val = max(max_col_val, float(col_val)) 676 | else: 677 | have_text_in_col = True 678 | break 679 | except: 680 | pass 681 | #这里如果k是 数字的话,包含百分数,那么去掉后面的百分号 682 | if not re.findall('[^\d\-\.\%]', str(k)) and '%' in str(k): 683 | k = str(k)[:-1] 684 | R['conds'].add((i, j, k)) 685 | if max(pcsel2[0][1:len(question) + 1].argmax(1)) > 0: 686 | pass 687 | R['conds'] = list(R['conds']) 688 | if len(R['conds']) <= 1: # 条件数少于等于1时,条件连接符直接为0 689 | R['cond_conn_op'] = 0 690 | else: 691 | R['cond_conn_op'] = 1 + pconn[0, 1:].argmax() # 不能是0 692 | return R 693 | 694 | 695 | def evaluate(data, tables): 696 | pbar = tqdm() 697 | F = open('../data/logs/evaluate_pred.json', 'w') 698 | pred_sql_list = [] 699 | gd_sql_list = [] 700 | tables_list = [] 701 | 702 | for i, d in enumerate(data): 703 | question = d['question'] 704 | table = tables[d['table_id']] 705 | R = nl2sql(question, table) # 706 | # print("predicted is {}\n".format(R)) 707 | gd_sql_list.append(d['sql']) 708 | pred_sql_list.append(R) 709 | tables_list.append(d['table_id']) 710 | pbar.update(1) 711 | d['sql_pred'] = R 712 | 713 | if PY2: 714 | s = json.dumps(d, ensure_ascii=False) # add str 715 | F.write(s.encode('utf-8') + '\n') 716 | elif PY3: 717 | s = json.dumps(eval(str(R)), ensure_ascii=False) 718 | F.write(s + '\n') # 719 | F.close() 720 | acc = check_part_acc(pred_sql_list, gd_sql_list, tables_list, data) 721 | print(' Acc in evaluate data set is {}'.format(1 - acc[-1])) # data here is valid data 722 | pbar.close() 723 | return 1 - acc[-1] 724 | 725 | 726 | if mode == 'evaluate': 727 | # model.load_weights(weight_save_path) # 728 | evaluate(valid_data, valid_tables) 729 | import sys 730 | sys.exit(0) 731 | 732 | 733 | def test(data, tables, submit_path): 734 | pbar = tqdm() 735 | model.load_weights(weight_save_path) # 736 | F = open(submit_path, 'w') 737 | for i, d in enumerate(data): 738 | question = d['question'] 739 | table = tables[d['table_id']] 740 | 741 | 742 | R = nl2sql(question, table) 743 | pbar.update(1) 744 | if PY2: 745 | s = json.dumps(R, ensure_ascii=False) 746 | F.write(s.encode('utf-8') + '\n') 747 | elif PY3: 748 | sql_pred = eval(str(R)) 749 | F.writelines(json.dumps(sql_pred, ensure_ascii=False) + '\n') 750 | F.close() 751 | pbar.close() 752 | 753 | if mode == 'test': 754 | print("Start create test result ....") 755 | # submit_path = '../submit/submit-{}.json'.format(time.strftime('%Y-%m-%d_%H:%M:%S', time.localtime(time.time()))) 756 | test(test_data, test_tables, test_submit_path) # add by shuai should used !!!!! 757 | print('Finish create test result and saved in {}'.format(test_submit_path)) 758 | import sys 759 | sys.exit(0) 760 | 761 | 762 | class Evaluate(Callback): 763 | def __init__(self): 764 | self.accs = [] 765 | self.best = 0 766 | self.passed = 0 767 | self.stage = 0 768 | 769 | def on_batch_begin(self, batch, logs=None): 770 | """ 771 | 第一个epoch用来warmup,第二个epoch把学习率降到最低 772 | """ 773 | if self.passed < self.params['steps']: 774 | lr = (self.passed + 1.) / self.params['steps'] * learning_rate 775 | K.set_value(self.model.optimizer.lr, lr) 776 | self.passed += 1 777 | elif self.params['steps'] <= self.passed < self.params['steps'] * 2: 778 | lr = (2 - (self.passed + 1.) / self.params['steps']) * (learning_rate - min_learning_rate) 779 | lr += min_learning_rate 780 | K.set_value(self.model.optimizer.lr, lr) 781 | self.passed += 1 782 | 783 | def on_epoch_end(self, epoch, logs=None): 784 | 785 | acc = self.evaluate() 786 | self.accs.append(acc) 787 | 788 | if acc >= self.best: 789 | self.best = acc 790 | train_model.save_weights(weight_save_path) 791 | print('acc: %.5f, best acc: %.5f\n' % (acc, self.best)) 792 | def evaluate(self): 793 | return evaluate(valid_data, valid_tables) 794 | 795 | 796 | evaluator = Evaluate() 797 | 798 | if __name__ == '__main__': 799 | train_model.fit_generator( 800 | train_D.__iter__(), 801 | steps_per_epoch=len(train_D), 802 | epochs=40, 803 | callbacks=[evaluator] 804 | ) 805 | 806 | else: 807 | train_model.load_weights(weight_save_path) 808 | -------------------------------------------------------------------------------- /code/post_treat.py: -------------------------------------------------------------------------------- 1 | import json 2 | import numpy as np 3 | import sys 4 | import os 5 | import re 6 | 7 | regex_tail = r'([十|百|千|万|亿]+)' 8 | regex_unit_second_level = r'([平|元|吨|件|支|股])' 9 | regex_num = r'([0|1|2|3|4|5|6|7|8|9]+)' 10 | format_oper_dict = {'十': 10, '千': 1000, '万': 10000, '万亿': 1000000000000, '亿': 100000000, 11 | '百万': 1000000, '百': 100, '十万': 100000, '千万': 10000000} 12 | 13 | title_unit_set = set([ 14 | '亿元', '亿美元', '万平方米', '万平', '千桶','万人','万平米','亿股', '万吨','万亿件','元/平米', 15 | '亿吨','亿件', '万支', '亿人民币', '亿', '万人次', '百万美元', '百万元']) 16 | 17 | unit_regexp = "亿元|亿美元|万平方米|万平|千桶|万人|万平米|亿股|万吨|万亿件|元/平米|亿吨|亿件|万支|亿人民币|亿|万人次|百万美元|百万元|万亿" 18 | 19 | unit_dict = {'元': set(['亿元', '百万元', '亿', '元/平米', '百万美元', '万亿', '万']), 20 | '件': set(['亿件', '万亿件', '百万件', '千万件']), 21 | '支': set(['亿支']), 22 | '人': set(['万人次']), 23 | '美元': set(['百万美元']), 24 | '平': set(['万平方米','万平米', '万平']), 25 | '吨':set(['亿吨', '万吨', '千吨', '十吨', '百吨']), 26 | '桶':set(['亿桶']), 27 | '股': set(['亿股']) 28 | } 29 | 30 | 31 | def smooth_numeric(start_idx, end_idx, question): 32 | """ 33 | 平滑处理数字缺失 34 | 有的数字只标注了一部分,比如 问题中有数字100,但是标记成了 40 35 | 通过该函数,可以补充start_idx和end_idx的位置,进而准确标注 36 | """ 37 | # question = ' ' + question 38 | match_val = question[start_idx: end_idx] 39 | if re.findall('[^\d\.]', match_val): # 找到非数字 40 | return start_idx, end_idx, match_val 41 | 42 | while start_idx >= 0 and not re.findall('[^\d\.]', question[start_idx]): 43 | start_idx -= 1 44 | 45 | while end_idx <= len(question) - 1 and not re.findall('[^\d\.]', question[end_idx]): 46 | end_idx += 1 47 | return start_idx + 1, end_idx, question[start_idx+1: end_idx] 48 | 49 | 50 | def get_append_unit(start_idx, end_idx, question): 51 | """ 52 | 获取数字后的单位, 53 | 标注出来的时候15, 问题当中可能是15万, 所以需要把这个单位搞出来,,搞出来的意义是为了后续的单位统一 54 | """ 55 | if re.findall('[^\d\.]', question[start_idx: end_idx]): # 找到非数字 56 | return '', '' 57 | start_idx, end_idx, val = smooth_numeric(start_idx, end_idx, question) 58 | unit_first = '' 59 | unit_second = '' 60 | # 获取 百十千万 61 | while end_idx <= len(question) - 1 and re.findall(regex_tail, question[end_idx]): 62 | unit_first += question[end_idx] 63 | end_idx += 1 64 | 65 | # 获取二级单位 平/元 66 | while end_idx <= len(question) - 1 and re.findall(regex_unit_second_level, question[end_idx]): 67 | unit_second += question[end_idx] 68 | end_idx += 1 69 | 70 | return unit_first, unit_second 71 | 72 | 73 | def get_unit_from_title(title): 74 | """ 75 |  从title中提取出 单位 76 | eg: 77 | title: '010年至今土地市场成交情况(万亿、万平)' 78 | ret: 万亿 万平  79 | """ 80 | # unit_regex = "(亿元).*?亿美元', '万平方米', '万平', '千桶','万人','万平米','亿股', '万吨','万亿件','元/平米', 81 | # '亿吨','亿件', '万支', '亿人民币', '亿', '万人次', '百万美元', '百万元'" 82 | unit_list = re.findall(r'((.*?))', title) 83 | 84 | if not unit_list: 85 | unit_list = re.findall(r'\((.*?)\)', title) 86 | if not unit_list: return unit_list 87 | title_unit = set([]) 88 | for unit in unit_list: 89 | unit_in_title = re.findall(unit_regexp, unit) 90 | 91 | if not unit_in_title: continue 92 | else: title_unit = set(unit_in_title) 93 | return title_unit 94 | 95 | 96 | def get_unit_set_from_title(): 97 | """ 98 | 从标题中找到所有可选单位 99 | """ 100 | unit_list = re.findall(r'((.*?))', title) 101 | if not unit_list: return None 102 | unit_ret = [] 103 | for unit in unit_list: 104 | if re.findall(regex_tail, unit): 105 | unit_ret.append(unit) 106 | return ' '.join(unit_ret) 107 | 108 | 109 | def number_trans(num, col_header, title, format_of_number=None, format_desc=None): 110 | """ 111 | 将数字转换为和表头单位一致 112 | input: num 113 | col_format: 列的格式(百万,千万等,先适配简单数字) 114 | titile: 图表标题 115 | format_of_number: 当前数字后面的计量词(百十千万等) 116 | format_descL 描述数字的,比如"件","元"等 117 | 118 | 同时还需要数字补齐等功能 119 | """ 120 | ori_num = num 121 | col_header = col_header.replace('km', '千米') 122 | col_header = col_header.replace('KM', '千米') 123 | col_header = col_header.replace('kg', '千克') 124 | # 解析出header中的单位, 另外如果header里面没有单位,需要到title里面去找 125 | col_format = None 126 | if re.findall(regex_tail, col_header) and '百分比' not in col_header: 127 | col_format = re.findall(regex_tail, col_header) 128 | col_format = col_format[0] # col_format为header中col的量词格式 129 | else: # 从标题里面找单位 130 | # 单位不出现在列名称里面,就可能出现在标题里面 131 | # title里面单位的格式还是很单一的,比如万, 万平 等, 132 | unit_from_title = get_unit_from_title(title) # set 133 | # 判断传入的是否是纯数字,如果是不是纯数字,而是后面带着单位的,那么需要修改下 134 | if format_of_number is not None: 135 | num = num * format_oper_dict.get(format_of_number) 136 | 137 | # 数字转 对应的单位的值 138 | # 首先考虑列名称中的单位 139 | if col_format: # 如果header中包含单位 140 | if num < format_oper_dict.get(col_format, 1): return num 141 | num_ret = int(int(num) / format_oper_dict.get(col_format, 1)) 142 | 143 | return num_ret 144 | else: # 如果header中没有单位,那么考虑标题中的单位 145 | unit_in_title_set = get_unit_from_title(title) 146 | if unit_in_title_set is None or len(unit_in_title_set) == 0: return num ### new add 147 | 148 | if format_desc is None: # 如果数字后面没有 支|个|吨|平 这些东西 149 | # 只能拿出和钱相关的, 有其他单位,比如“支”等不行 150 | unit_in_title_set = set([unit for unit in unit_in_title_set if not re.findall(r'([支|个|吨|平]+)', unit) ]) 151 | unit = unit_in_title_set 152 | if len(unit) == 0: return num 153 | else: 154 | if unit_dict.get(format_desc, None) is None: 155 | unit = unit_in_title_set 156 | else: 157 | unit = unit_in_title_set & unit_dict.get(format_desc, None) 158 | # 从unit中获取到量词 159 | unit = unit.pop() 160 | # 匹配出计量词 161 | unit_in_strs = re.findall(regex_tail, unit) 162 | if not unit_in_strs: return ori_num 163 | title_unit_format = unit_in_strs[0] 164 | ret = int(int(num) / format_oper_dict.get(title_unit_format, 1)) 165 | if ret == 0: return ori_num 166 | else: return ret 167 | return num 168 | 169 | 170 | def number_trans_test(): 171 | """ number_trans函数测试""" 172 | 173 | assert number_trans(90000,'商品房新开工面积','63 图表 :2006年至2012年房地产投资模型(万平方米)',format_of_number='万', format_desc='平') ==90000 174 | assert number_trans(50000,'商品房竣工面积增速','63 图表 :2006年至2012年房地产投资模型(万平方米)',format_of_number='万', format_desc='平') ==50000 175 | assert number_trans(5,'商品房新开工面积','63 图表 :2006年至2012年房地产投资模型(万平方米)',format_of_number='亿', format_desc='平') ==50000 176 | assert number_trans(5,'商品房竣工面积增速','63 图表 :2006年至2012年房地产投资模型(万平方米)',format_of_number='亿', format_desc='平') ==50000 177 | assert number_trans(5,'商品房竣工面积','63 图表 :2006年至2012年房地产投资模型(万平方米)',format_of_number='亿', format_desc='平') ==50000 178 | assert number_trans(9,'商品房新开工面积','63 图表 :2006年至2012年房地产投资模型(万平方米)',format_of_number='亿', format_desc='平') ==90000 179 | assert number_trans(70,'上周成交量','图17、重点类型城市二手房成交数据(万平米)',format_of_number='万', format_desc='平') ==70 180 | assert number_trans(100,'当月累计成交量','图17、重点类型城市二手房成交数据(万平米)',format_of_number='万', format_desc='平') ==100 181 | assert number_trans(70,'上周成交量','图17、重点类型城市二手房成交数据(万平米)',format_of_number='万', format_desc='平') ==70 182 | assert number_trans(100,'当月累计成交量','图17、重点类型城市二手房成交数据(万平米)',format_of_number='万', format_desc='平') ==100 183 | assert number_trans(70,'上周成交量','图17、重点类型城市二手房成交数据(万平米)',format_of_number='万', format_desc='平') ==70 184 | assert number_trans(100,'当月累计成交量','图17、重点类型城市二手房成交数据(万平米)',format_of_number='万', format_desc='平') ==100 185 | assert number_trans(40,'总市值(亿港元)','表 3:传媒互联网行业港股情况 传媒互联网行业港股情况',format_of_number='亿', format_desc=None) ==40 186 | assert number_trans(40,'总市值(亿港元)','表 3:传媒互联网行业港股情况 传媒互联网行业港股情况',format_of_number='亿', format_desc=None) ==40 187 | 188 | 189 | if __name__ == "__main__": 190 | number_trans_test() 191 | -------------------------------------------------------------------------------- /code/question_prepro.py: -------------------------------------------------------------------------------- 1 | #coding=utf-8 2 | import os 3 | import sys 4 | import jieba 5 | import collections 6 | import cn2an 7 | import numpy as np 8 | import re 9 | import json 10 | from config import * 11 | from utils import read_data 12 | 13 | # 正则匹配区 14 | ## 用于匹配数量前后常用词汇 15 | regex = r'([^零一二两三四五六七八九十百千万亿]{0,2})([零|一|二|两|三|四|五|六|七|八|九|十|百|千|万]+)([^零一二两三四五六七八九十百千万]{0,3})' 16 | # 用于匹配数字 17 | re_match_list = [ 18 | r'([零|一|二|两|三|四|五|六|七|八|九|十|百|千|万|亿]+[点|块][零|一|二|两|三|四|五|六|七|八|九|十|百|千]+)' , # 小数 19 | r'(百分之[一|二|两|三|四|五|六|七|八|九|十|百|千|万|亿|零|0|1|2|3|4|5|6|7|8|9|\.]+)', #百分数 20 | r'([零|一|二|两|三|四|五|六|七|八|九|十|百|千|万|亿]+)' # 数字并且已经把 多少元一平 中 的"一平"剔除了 21 | ] 22 | # 匹配年份 23 | year_mat = re.compile(r"(\d{2,4})年") 24 | 25 | # 词表部分 26 | # 匹配到下面的时候替换 27 | good_set = set(['于倍', '于分', '过分', '过块', '招人', '过的', '前的', '过倍', '年月', '到分', '在月', '在亿', 28 | '概天','到月', '于元', '在年', '于平', '足平', '过股', '过套', '招位', '前', '前中', '前名', '前个', '前,', '于的', '过毛', '近天', 29 | '过平', '前家', '过的', '前里','前最', '到以', '第的', '足或','和月', '是元','前大', '在块', '有年', '超,', '些年', '计年', '在倍', '月号', '批年', '年', '超套', 30 | '至日', '过,', '过平', '有年', ',年', '到年', '道年', '月日', '日', '号', '为年', '在的', '共元', '共克', '共个', '费元', '元','招个', 31 | '于个', '超册', '场月', '于岁', '过岁', '在周', '为且', '招名', '的克', '是份', '是个', '达平','我年', '是平', '为的', '为是', '在个','过枚', '有个', 32 | '由个', '中个', '在以', '有个', '有集','到亿', '过的','止的', '了册', '超的','聘个', '于集', '给块', '要元','在号', '在公','在百','在元','米元', 33 | '道块', '卖元', '要?', '聘名', '到块', '卖块', '过元', '过集', '于枚', '于册', '为人', '是题', '诶号','了平', '达亿','有家', '映天', '破亿','破千', 34 | '在以','止个','和的', '有平', '超亿', '于亿','超个', '超块', '破元', '超平', '近套', '在平', '些年', '和年', '或月', '了平', '破的', '超倍', '在亿', 35 | '前中','前的', '卖元', '超套', '有艘', '超元','是年', '有册', '要人','招个','在枚', '超元', 36 | '超台', '招人', '超人','要个','在集','卖元','聘位', '买只']) 37 | 38 | 39 | # 数词前面常用的2字前缀 40 | good_set_2_char = set(['大于', '等于', '小于', '超过', '一共', '达到', '达到', '高于', '低于', '不足', '少于', 41 | '成交', '高过','不足','总计', '排名', '名次', '破了', '每股', '过了', '不到','超过','年的', 42 | '最近', '月还', '幅后', '幅前', '没破', '低于', '收费', 43 | '不到', '多于', '于了','需要','每平' 44 | ]) 45 | good_set_tail_2_char = set(['以上', '克的', '块钱', '平米', '多人', '多个', '多名','每平', 46 | '每个','每只','每双', '毛钱', '月份', '车道','毫升', '级的']) 47 | 48 | good_set_tail_3_char = set(['亿以上', '平方米', '元以下', '的排行', '个以上', '名以上', '美元以']) 49 | 50 | bad_set = set(['问下', '查下', '解下', '询下', '第季', '说下', '我下', '这本', '共', '这周', '哪个', '查本', '这个', '知下', '问共', '第第', '第', '第周', '算下','了等', '估下', 51 | '第中', '第医', '哪年', '近周', '算算', '这部', '迹代', '查查', '周手', '珠角','剧共','集共', '哪天', '书共', '的季', '近年', '第高', '高的', 52 | '第步','和世','第批','不不','交手','的川','同时','上般','上本','第章', '新线', '下年']) 53 | 54 | metric_dict = {'十': 10, '百': 100, '千':1000, '万': 10000} 55 | 56 | digit_set = set(['一', '二', '两', '三', '四', '五', '六', '七', '八', '九', '十']) 57 | 58 | digit_dict ={'零':0, '一':1, '二':2, '三':3, '四':4, '五':5, '六':6, '七':7, '八':8, '九':9, '十':10, '百':100, '千':1000, '万':10000, 59 | '0':0, '1':1, '2':2, '3':3, '4':4, '5':5, '6':6, '7':7, '8':8, '9':9, '两': 2, 60 | '壹':1, '贰':2, '叁':3, '肆':4, '伍':5, '陆':6, '柒':7, '捌':8, '玖':9, '拾':10, '佰':100, '仟':1000, '萬':10000, 61 | '亿':100000000} 62 | bad_q = set(['十二五']) 63 | 64 | 65 | def get_data_and_table(): 66 | """ 67 | 获取所有可用数据和表 68 | """ 69 | valid_data, valid_tables = read_data( 70 | os.path.join(valid_data_path, 'val.json'), 71 | os.path.join(valid_data_path, 'val.tables.json') 72 | ) # 4396 1197 73 | # headers = valid_tables['xxx']['content'][valid_tables['xxxx']['headers'][0]] 74 | 75 | test_data, test_tables = read_data( 76 | os.path.join(test_file_path, 'final_test.json'), 77 | os.path.join(test_file_path, 'final_test.tables.json') 78 | ) 79 | 80 | 81 | train_data, train_tables = read_data( 82 | os.path.join(train_data_path, 'train.json'), 83 | os.path.join(train_data_path, 'train.tables.json') 84 | ) # 41522 5013 85 | all_data = [] 86 | all_data.extend(train_data) 87 | all_data.extend(valid_data) 88 | all_data.extend(test_data) 89 | 90 | all_tables = {} 91 | all_tables.update(train_tables) 92 | all_tables.update(valid_tables) 93 | all_tables.update(test_tables) 94 | return all_data, all_tables 95 | 96 | 97 | def get_2_word_before_num(num=100): 98 | """ 99 | 获取数字前最常见的两个字,默认获取top100 100 | 101 | 已经人工标注出了几个常用的,放到 good_set_2_char 里面了 102 | """ 103 | all_data, all_tables = get_data_and_table() 104 | 105 | word_2_list = [] 106 | 107 | for data in all_data: 108 | question = data['question'] 109 | re_rule_upper = re.compile(regex) 110 | ret_iter = re_rule_upper.finditer(question) 111 | if ret_iter is None: return None 112 | # iter转置,这样 后续拼接的时候就不用考虑位置错位了 113 | ret_iter = [iter for iter in ret_iter][::-1] 114 | for ret in ret_iter: 115 | word_2_list.append(ret.group(1)) 116 | most_common_2_word = collections.Counter(word_2_list).most_common(num) 117 | return most_common_2_word 118 | 119 | 120 | def find_upper_and_replace(question): 121 | """ 122 | 替换问题中的大小数字 123 | """ 124 | re_rule_upper = re.compile(regex) 125 | ret_iter = re_rule_upper.finditer(question) 126 | if ret_iter is None: return None 127 | # iter转置,这样 后续拼接的时候就不用考虑位置错位了 128 | ret_iter = [iter for iter in ret_iter][::-1] 129 | for ret in ret_iter: 130 | match_start, match_end = ret.span() 131 | match_val = ret.group(2) 132 | # 左侧匹配部分需要做处理 133 | left_part = ret.group(1) 134 | # 下面做漏斗处理 135 | right_part = ret.group(3) 136 | 137 | if left_part == '': left_part = ' ' 138 | if ret.group(3) == '': right_part = ' ' 139 | 140 | if (left_part[-1].strip() + ret.group(3).strip()[0:1] not in good_set) and\ 141 | (left_part not in good_set_2_char) and \ 142 | right_part[-3:-1].strip() not in good_set_tail_2_char and \ 143 | right_part[-3:].strip() not in good_set_tail_3_char: 144 | continue 145 | try: 146 | match_trans = cn2an.cn2an(match_val, "normal") 147 | if match_trans == int(match_trans): match_trans = int(match_trans) 148 | except: 149 | try: # 尝试添加一个"一" 150 | match_trans = match_val 151 | 1 == 0 # 下面这块先短路吧,,, 152 | pass 153 | # match_trans = cn2an.cn2an('一' + match_val, "normal") 154 | # if match_trans == int(match_trans): match_trans = int(match_trans) 155 | except : 156 | try:# 二十万一平 157 | match_trans = cn2an.cn2an(match_val[:-1], "normal") 158 | if match_trans == int(match_trans): match_trans = int(match_trans) 159 | except: 160 | print(' find_upper_and_replaceException find {}'.format(match_val)) 161 | continue 162 | 163 | question = question[:match_start] + \ 164 | ret.group(1) + str(match_trans) + \ 165 | ret.group(3) + question[match_end:] 166 | 167 | return question 168 | 169 | 170 | def is_decimal(num): 171 | """ 172 | 判断一个数字是否是小数 173 | """ 174 | if '.' not in num: return False 175 | val_split = str(num).split('.') 176 | if len(val_split) != 2: return False 177 | return True if val_split[0].isdigit() and val_split[1].isdigit() else False 178 | 179 | def trans_percent_val(strs): 180 | """ 181 | 将question中的中文百分数转换为数字 182 | eg: 183 | input: '增幅百分之二百的股票比降幅百分之二十三的大娘' 184 | output: 增幅200%的股票比降幅23%的大娘 185 | """ 186 | while '百分之' in strs: 187 | start_pos = strs.find('百分之') 188 | pos = start_pos + 3 189 | num = '' 190 | for i in range(pos, len(strs)): 191 | if strs[i].isnumeric() or strs[i] == '.' : 192 | num += strs[i] 193 | else: 194 | break 195 | if num == '': return strs 196 | if not num.isdigit() and not is_decimal(num) and num not in metric_dict.keys(): 197 | new_num = replace_q(num) 198 | elif num in metric_dict.keys(): 199 | new_num = metric_dict.get(num) 200 | else: 201 | new_num = num 202 | strs = strs.replace('百分之' + num, str(new_num) + '%') 203 | return strs 204 | 205 | 206 | def replace_q(input_s): 207 | """ 208 | 将小词组中的 中文数字表示 转换为阿拉伯形式 209 | """ 210 | if input_s in set(['个', '十', '百', '千', '万']): return input_s 211 | # if input_s[0] in set(['个', '十', '百', '千', '万']): return input_s 212 | if input_s in bad_q: return input_s 213 | start_idx = 0 214 | end_idx = len(input_s) - 1 215 | for v in input_s: 216 | if v not in digit_dict.keys(): 217 | start_idx += 1 218 | else: 219 | break 220 | for v in input_s[::-1]: 221 | if v not in digit_dict.keys(): 222 | end_idx -= 1 223 | else: 224 | break 225 | center = cn2an.cn2an(input_s[start_idx: end_idx + 1], "normal") 226 | if len(str(center).split('.')) > 1 and str(center).split('.')[1] == '0': center = int(center) 227 | 228 | left_part = input_s[0: start_idx] 229 | right_part = input_s[end_idx + 1:] 230 | if left_part == right_part and left_part != '': 231 | return left_part 232 | return left_part + str(center) + right_part 233 | 234 | 235 | def trans_question_acc(question): 236 | """ 237 | 更加精准的匹配替换,将question中的中文数字替换为阿拉伯数字 238 | """ 239 | question = question.replace(' ', '') 240 | question = question.replace(' ', '') 241 | question = question.rstrip() 242 | global re_match_list 243 | re_match_list = re_match_list[0:2] # 只需要匹配好小数和百分数 244 | for re_match in re_match_list: 245 | # re_match 为每个正则表达式 246 | question_trans = '' 247 | pattern = re.compile(re_match) 248 | search_start = 0 249 | while pattern.search(question, search_start) is not None: 250 | padding_cnt = 0 251 | match_sre = pattern.search(question, search_start) 252 | match_val = match_sre.group() 253 | append_part = '' 254 | except_unwant = False 255 | if '百分之' in match_val: 256 | match_val_trans = trans_percent_val(match_val) 257 | else: 258 | try: 259 | if '块' in match_val: match_val = match_val.replace('块', '点') 260 | match_val_trans = cn2an.cn2an(match_val, 'strict') 261 | except: 262 | try: 263 | match_val_trans = cn2an.cn2an(match_val[:-1], 'strict') 264 | append_part = match_val[-1] 265 | except: 266 | except_unwant = True 267 | match_val_trans = match_val 268 | if not except_unwant: 269 | if '点' not in match_val and '块' not in match_val: match_val_trans = int(match_val_trans) 270 | match_val_trans = str(match_val_trans) + append_part 271 | question = question[0: match_sre.start()] + str(match_val_trans) + question[match_sre.end():] 272 | search_start = match_sre.start() + len(str(match_val_trans)) 273 | question = find_upper_and_replace(question) 274 | return question 275 | 276 | 277 | def trans_question_acc_test(): 278 | """ 279 | trans_question_acc函数测试 280 | """ 281 | assert trans_question_acc('什么小学的岗位只招一人?') == '什么小学的岗位只招1人?' 282 | assert trans_question_acc('这些东西一共二十八万元,请缴费一元即可,或者给百分之三十的一点二返现 ') == '这些东西一共280000元,请缴费1元即可,或者给30%的1.2返现' 283 | assert trans_question_acc('我问你啊就是那个幕后之王收视率超过了百分之零点九,它是在哪个台播的呀') == '我问你啊就是那个幕后之王收视率超过了0.9%,它是在哪个台播的呀' 284 | assert trans_question_acc('想要了解一下这周的换手率低于百分之十八的股票的涨跌幅的情况') == '想要了解一下这周的换手率低于18%的股票的涨跌幅的情况' 285 | 286 | 287 | 288 | def trans_question_short_year(question): 289 | 290 | mat_val = year_mat.findall(question) 291 | if mat_val and len(mat_val) == 1 and len(mat_val[0]) == 2: 292 | question = question.replace('{}年'.format(mat_val[0]), '20{}年'.format(mat_val[0])) 293 | return question 294 | 295 | 296 | def get_all_vals_contains_num(): 297 | """ 298 | 获取包含数字的专有名词,数据探查函数 299 | """ 300 | train_data, train_tables = read_data( 301 | os.path.join(train_data_path, 'train.json'), 302 | os.path.join(train_data_path, 'train.tables.json') 303 | ) # 41522 5013 304 | val_set = set([]) 305 | re_rule_upper = re.compile(regex) 306 | all_tables = {} 307 | all_tables.update(train_tables) 308 | all_tables.update(valid_tables) 309 | all_tables.update(test_tables) 310 | for t in all_tables: 311 | for val in all_tables[t]['all_values']: 312 | if not val.isnumeric() and len(val) <= 10: 313 | 314 | ret_iter = re_rule_upper.finditer(val) 315 | if ret_iter is None: continue 316 | for ret in ret_iter: 317 | if ret.group(1) + ret.group(3) not in good_set: continue 318 | val_trans = ret.group(1) + ret.group(2) + ret.group(3) 319 | 320 | val_set.add(val + '||||' + val_trans ) 321 | path = '../data' 322 | f = open(os.path.join(path, 'entity'), 'w') 323 | for val_pair in val_set: 324 | f.write(val_pair + '\n') 325 | f.close() 326 | 327 | 328 | if __name__ == "__main__": 329 | trans_question_acc_test() 330 | 331 | 332 | 333 | 334 | -------------------------------------------------------------------------------- /code/start_test.sh: -------------------------------------------------------------------------------- 1 | #!/usr/bin/bash 2 | PYTHONHASHSEED=0 python nl2sql_main.py --mode='test' -------------------------------------------------------------------------------- /code/start_train.sh: -------------------------------------------------------------------------------- 1 | #!/usr/bin/bash 2 | python nl2sql_main.py --mode='train' -------------------------------------------------------------------------------- /code/utils.py: -------------------------------------------------------------------------------- 1 | 2 | 3 | from config import * 4 | import os 5 | import json 6 | import numpy as np 7 | 8 | 9 | def read_data(data_file, table_file): 10 | data, tables = [], {} 11 | with open(data_file) as f: 12 | for l in f: 13 | data.append(json.loads(l)) 14 | with open(table_file) as f: 15 | for l in f: 16 | l = json.loads(l) 17 | d = {} 18 | d['headers'] = l['header'] 19 | d['header2id'] = {j: i for i, j in enumerate(d['headers'])} 20 | d['content'] = {} 21 | d['keywords'] = {} 22 | d['all_values'] = set() 23 | d['types'] = l['types'] 24 | d['title'] = l['title'] 25 | rows = np.array(l['rows']) 26 | for i, h in enumerate(d['headers']): 27 | d['content'][h] = set(rows[:, i]) 28 | if d['types'][i] == 'text': 29 | d['keywords'][i] = '' 30 | # get_key_words(d['content'][h]) 31 | else: 32 | d['keywords'][i] = '' 33 | 34 | d['all_values'].update(d['content'][h]) 35 | d['all_values'] = set([i for i in d['all_values'] if hasattr(i, '__len__')]) 36 | tables[l['id']] = d 37 | return data, tables 38 | 39 | train_data, train_tables = read_data( 40 | os.path.join(train_data_path, 'train.json'), 41 | os.path.join(train_data_path, 'train.tables.json') 42 | ) # 41522 5013 43 | 44 | 45 | def check_num_exactly_match(num, question): 46 | """ 47 |    判断数字是否可以全匹配 48 | 49 | ret : 50 | find_cnt=0 表示没有找到 51 | find_cnt=1 表示精确匹配到1个 52 | find_cnt=2 表示精确匹配到2个 53 | 54 |   一般程序后续做处理的时候,要根据find_cnt的不同进行分类处理: 55 | find_cnt =1 情况下,是精准匹配,可以将一些包含两个不同数字的区分开 56 | find_cnt = 2 xxxxxx 57 | """ 58 | num = str(num) 59 | find_start_idx = 0 60 | find_cnt = 0 61 | num_start_idx, num_end_idx = 0, 0 62 | while question.find(num, find_start_idx) != -1: 63 | find_start_idx = question.index(num, find_start_idx) 64 | val_start_idx = find_start_idx - 1 65 | val_end_idx = find_start_idx + len(num) 66 | while val_start_idx >= 0 and question[val_start_idx] >= '0' and question[val_start_idx] <= '9': 67 | val_start_idx = val_start_idx - 1 68 | 69 | while val_end_idx < len(question) and question[val_end_idx] >= '0' and question[val_end_idx] <= '9': 70 | val_end_idx = val_end_idx + 1 71 | 72 | if val_start_idx < find_start_idx - 1: # 确定不匹配 73 | find_start_idx = val_end_idx 74 | elif val_end_idx > find_start_idx + len(num) \ 75 | and int(question[find_start_idx + len(num): val_end_idx]) != 0: 76 | find_start_idx = val_end_idx 77 | else: 78 | find_cnt += 1 79 | num_start_idx = val_start_idx + 1 80 | num_end_idx = val_end_idx - 1 81 | 82 | find_start_idx = val_end_idx 83 | #print(find_cnt, num_start_idx, num_end_idx, val_start_idx, val_end_idx) 84 | return find_cnt, num_start_idx, num_end_idx 85 | 86 | 87 | 88 | def check_num_exactly_match_test(): 89 | assert check_num_exactly_match(1, '2011年北京排名第1的品牌') == (1, 10,10) 90 | assert check_num_exactly_match(1, '1年北京排名第11的品牌') == (1, 0, 0) 91 | assert check_num_exactly_match(1, '11年北京排名第11的品牌')[0] == 0 92 | assert check_num_exactly_match(20, '销量大于20吨且盈利大于20万的商品')[0] == 2 93 | assert check_num_exactly_match(11, '11年北京排名第11的品牌')[0] == 2 94 | assert check_num_exactly_match(2, '2020年销量大于20且盈利为2的品牌是啥')[0] == 2 ## 这种反例一定要考虑哦 95 | assert check_num_exactly_match(20, '2020年销量大于20且盈利为2的品牌是啥')== (1, 9,10) 96 | 97 | 98 | def check_num_exactly_match_zero_case(num, question): 99 | """ 100 |    判断数字是否可以全匹配 101 | 102 | ret : 103 | find_cnt=0 表示没有找到 104 | find_cnt=1 表示精确匹配到1个 105 | find_cnt=2 表示精确匹配到2个 106 | 107 | 只有find_cnt=1可用 108 | """ 109 | num = str(num) 110 | find_start_idx = 0 111 | find_cnt = 0 112 | num_start_idx, num_end_idx = 0, 0 113 | while question.find(num, find_start_idx) != -1: 114 | find_start_idx = question.index(num, find_start_idx) 115 | val_start_idx = find_start_idx - 1 116 | val_end_idx = find_start_idx + len(num) 117 | while val_start_idx >= 0 and question[val_start_idx] >= '0' and question[val_start_idx] <= '9': 118 | val_start_idx = val_start_idx - 1 119 | 120 | while val_end_idx < len(question) and question[val_end_idx] >= '0' and question[val_end_idx] <= '9': 121 | val_end_idx = val_end_idx + 1 122 | 123 | if val_start_idx < find_start_idx - 1: #  如果从该值的左侧出现数字的话,确定不匹配, 124 | find_start_idx = val_end_idx 125 | elif val_end_idx > find_start_idx + len(num): 126 | # and int(question[find_start_idx + len(num): val_end_idx]) != 0: 127 | find_start_idx = val_end_idx 128 | else: 129 | find_cnt += 1 130 | num_start_idx = val_start_idx + 1 131 | num_end_idx = val_end_idx - 1 132 | 133 | find_start_idx = val_end_idx 134 | #print(find_cnt, num_start_idx, num_end_idx, val_start_idx, val_end_idx) 135 | return find_cnt, num_start_idx, num_end_idx 136 | 137 | 138 | def check_num_exactly_match_zero_case_test(): 139 | assert check_num_exactly_match_zero_case(20, '2000年销量大于20且盈利为2的品牌是啥') == (1, 9, 10) 140 | assert check_num_exactly_match_zero_case(20, '20年来北京卖出2000套且盈利为2的品牌是啥') == (1, 0, 1) 141 | assert check_num_exactly_match_zero_case(20, '20年来北京卖出2000套且盈利为20%的品牌是啥') == (2, 17, 18) 142 | # print(check_num_exactly_match_zero_case(10, '最新市值低于10000000并且市值比重不足10个百分点的股,最新股价为多少')) 143 | assert check_num_exactly_match_zero_case(1000, '19年第1周有哪些电影周票房超过10000000并且票房占比高于10%的?') == (0, 0, 0) 144 | 145 | 146 | if __name__ == "__main__": 147 | check_num_exactly_match_test() 148 | check_num_exactly_match_zero_case_test() 149 | 150 | 151 | 152 | -------------------------------------------------------------------------------- /data/logs/where_oper_error.log: -------------------------------------------------------------------------------- 1 | {"question": "你好啊,就是本周销量低于2000套,或者少于20万平都是哪些城市,其销量环比多少啊", "table": "c98e2fe8332111e998d5542696d6e445"} 2 | {"sql_right": {"agg": [0, 0], "cond_conn_op": 2, "sel": [0, 5], "conds": [[3, 1, "2000"], [4, 1, "20"]]}} 3 | {"sql_pred": {"agg": [0, 0], "sel": [0, 5], "conds": [[3, 1, 200000], [3, 1, 2000]], "cond_conn_op": 2}} 4 | {"question": "啊,你好,麻烦告诉我新房成交的一个变化率,在本周销售套数低于1000套的范围内就可以", "table": "69d2d58a334311e998d7542696d6e445"} 5 | {"sql_right": {"agg": [0], "cond_conn_op": 0, "sel": [10], "conds": [[2, 0, "1000"]]}} 6 | {"sql_pred": {"agg": [0], "sel": [10], "conds": [[2, 1, 1000]], "cond_conn_op": 0}} 7 | {"question": "二等座单价小于0.5元每公里而且一等座单价小于0.6元每公里的动车组有哪些", "table": "c5ad8a9134b411e984f8542696d6e445"} 8 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [0], "conds": [[5, 1, "0.5"], [4, 1, "0.60"]]}} 9 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[4, 1, "0.5"], [4, 1, "0.6"]], "cond_conn_op": 1}} 10 | {"question": "最新市值达到100亿的北辰实业,最新的每股价格是多少", "table": "5a508682312b11e9b885542696d6e445"} 11 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [3], "conds": [[2, 2, "100"], [1, 2, "北辰实业"]]}} 12 | {"sql_pred": {"agg": [0], "sel": [3], "conds": [[1, 2, "北辰实业"], [2, 0, 100]], "cond_conn_op": 1}} 13 | {"question": "指标发热量/规格是多少时喷吹煤产地价格在上个月或者上一年每吨超过10000块", "table": "c5ae457034b411e98c59542696d6e445"} 14 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [9], "conds": [[5, 0, "1000"], [7, 0, "1000"]]}} 15 | {"sql_pred": {"agg": [0], "sel": [9], "conds": [[0, 2, "山西喷吹煤均价"], [5, 0, 10000]], "cond_conn_op": 2}} 16 | {"question": "你号,这边想咨询一下2011同期或者2012至今土地成交金额分别大于100亿和50亿的三线城市的10年成交面积均值", "table": "69d5567a334311e99539542696d6e445"} 17 | {"sql_right": {"agg": [1], "cond_conn_op": 2, "sel": [1], "conds": [[3, 0, "100"], [4, 0, "50"]]}} 18 | {"sql_pred": {"agg": [1], "sel": [1], "conds": [[4, 0, 50], [4, 0, 100]], "cond_conn_op": 2}} 19 | {"question": "请问铁路运输Ⅱ(申万)这一周的涨跌幅已达到1,你知道这个月涨跌幅是多少吗?", "table": "733c4cb334c611e9b645542696d6e445"} 20 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [4], "conds": [[1, 2, "铁路运输Ⅱ(申万)"], [3, 0, "1"]]}} 21 | {"sql_pred": {"agg": [0], "sel": [4], "conds": [[3, 2, "1.73"], [1, 2, "港口Ⅱ(申万)"]], "cond_conn_op": 1}} 22 | {"question": "在这些视频平台里爱奇艺排第几啊?", "table": "4d2a3de33aaa11e9bfe7f40f24344a08"} 23 | {"sql_right": {"agg": [4], "cond_conn_op": 0, "sel": [1], "conds": [[2, 0, "1000"]]}} 24 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[1, 2, "斗魂卫之玄月奇缘"]], "cond_conn_op": 0}} 25 | {"question": "你可以帮我查一下那些19年的每股盈余估值低于1,市盈率估值也低于20,还有净利润增长率也低于100%的股票的平均市净率吗", "table": "463e64ee351411e99af2542696d6e445"} 26 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [11], "conds": [[3, 1, "1"], [6, 1, "100"], [9, 1, "20"]]}} 27 | {"sql_pred": {"agg": [1], "sel": [6], "conds": [[9, 1, 20], [5, 1, 1], [9, 1, 100]], "cond_conn_op": 1}} 28 | {"question": "你好,我想知道这些估计19年的盈利增长率在100%以下,每股收益也在1以下,而且本益比也在20以下的航空公司的市净率", "table": "463e64ee351411e99af2542696d6e445"} 29 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [11], "conds": [[3, 1, "1"], [6, 1, "100"], [9, 1, "20"]]}} 30 | {"sql_pred": {"agg": [0], "sel": [6], "conds": [[8, 1, 1], [8, 1, 20], [8, 1, 100]], "cond_conn_op": 1}} 31 | {"question": "我想问一下周成交的情况,哪些城市在2012年2月份成交量环比超过10以及2011年12月成交量环比低于10的", "table": "69d14c3a334311e9b68e542696d6e445"} 32 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [0], "conds": [[3, 0, "10"], [5, 1, "10"]]}} 33 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[6, 1, 10], [6, 0, 10]], "cond_conn_op": 1}} 34 | {"question": "请问在2011年12月成交量环比小于10并且2011年11月成交量环比小于5的主要集中在几线城市?", "table": "69d14c3a334311e9b68e542696d6e445"} 35 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [0], "conds": [[5, 1, "10"], [6, 1, "5"]]}} 36 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[6, 1, 10], [6, 1, 5]], "cond_conn_op": 1}} 37 | {"question": "我想知道有哪些城市在2011年12月成交量环比是低于10的以及同年11月成交量环比是在5以下的", "table": "69d14c3a334311e9b68e542696d6e445"} 38 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [0], "conds": [[5, 1, "10"], [6, 1, "5"]]}} 39 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[6, 1, 10], [6, 1, 5]], "cond_conn_op": 1}} 40 | {"question": "有哪些城市12月成交量环比在10以下,并且11月里它的成交量环比低于5?", "table": "69d14c3a334311e9b68e542696d6e445"} 41 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [0], "conds": [[5, 1, "10"], [6, 1, "5"]]}} 42 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[6, 1, 10], [6, 1, 5]], "cond_conn_op": 1}} 43 | {"question": "市净率大于1%或者每股净资产大于5块的股票股价是多少", "table": "0155563d351311e9b279542696d6e445"} 44 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [1], "conds": [[9, 0, "1"], [8, 0, "5"]]}} 45 | {"sql_pred": {"agg": [0], "sel": [1], "conds": [[8, 0, 5], [8, 0, 1]], "cond_conn_op": 2}} 46 | {"question": "你知道市净率大于1%或者每股净资产大于5块的股票股价吗", "table": "0155563d351311e9b279542696d6e445"} 47 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [1], "conds": [[9, 0, "1"], [8, 0, "5"]]}} 48 | {"sql_pred": {"agg": [0], "sel": [1], "conds": [[8, 0, 5], [8, 0, 1]], "cond_conn_op": 2}} 49 | {"question": "3Q18/2Q18大于 5并且3Q18/3817大于10的区域总共有多少?", "table": "0de65b47351311e99df6542696d6e445"} 50 | {"sql_right": {"agg": [4], "cond_conn_op": 1, "sel": [0], "conds": [[4, 0, "5"], [5, 0, "10"]]}} 51 | {"sql_pred": {"agg": [4], "sel": [0], "conds": [[4, 0, 10], [4, 0, 5]], "cond_conn_op": 1}} 52 | {"question": "总共有多少个区域3Q18/2Q18大于 5并且3Q18/3817大于10的?", "table": "0de65b47351311e99df6542696d6e445"} 53 | {"sql_right": {"agg": [4], "cond_conn_op": 1, "sel": [0], "conds": [[4, 0, "5"], [5, 0, "10"]]}} 54 | {"sql_pred": {"agg": [4], "sel": [0], "conds": [[4, 0, 10], [4, 0, 5]], "cond_conn_op": 1}} 55 | {"question": "一线城市房地产可售环比为负值或者可售去化时间不足一年半的是哪种类型的房", "table": "c98ac519332111e9b2b0542696d6e445"} 56 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [4], "conds": [[2, 1, "0"], [3, 1, "36"]]}} 57 | {"sql_pred": {"agg": [0], "sel": [1], "conds": [[2, 1, 0], [2, 2, "1.5"]], "cond_conn_op": 2}} 58 | {"question": "你好,咨询一下可售去化时间不足一年半或者可售环比小于0的房产类型", "table": "c98ac519332111e9b2b0542696d6e445"} 59 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [4], "conds": [[2, 1, "0"], [3, 1, "36"]]}} 60 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[2, 1, 0], [2, 2, "1.5"]], "cond_conn_op": 2}} 61 | {"question": "你好啊,那个东方财富不是说周前收盘价12块多吗,那那个周收盘价是多少啊", "table": "4d23bd663aaa11e99219f40f24344a08"} 62 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [3], "conds": [[1, 2, "东方财富"], [2, 0, "12"]]}} 63 | {"sql_pred": {"agg": [0], "sel": [3], "conds": [[3, 2, "12.1"], [1, 2, "东方财富"]], "cond_conn_op": 1}} 64 | {"question": "我想问问啊就是那个首都机场17前的免税运营商是哪个啊,首都机场不是15年底那个免税经营权就到期啊了吗", "table": "733d2b6634c611e9933c542696d6e445"} 65 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [1], "conds": [[0, 2, "首都机场"], [3, 2, "2015年底"]]}} 66 | {"sql_pred": {"agg": [0], "sel": [3], "conds": [[0, 2, "首都机场"], [0, 2, "白云机场"]], "cond_conn_op": 1}} 67 | {"question": "哪些板块的代码是000300.SH或者有300个成分股", "table": "4d251cf53aaa11e9bce2f40f24344a08"} 68 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [1], "conds": [[2, 1, "300"], [0, 2, "000300.SH"]]}} 69 | {"sql_pred": {"agg": [0], "sel": [1], "conds": [[2, 2, "300.0"], [0, 2, "000300.SH"]], "cond_conn_op": 2}} 70 | {"question": "成分股有300或者代码为000300.SH指的是哪些板块", "table": "4d251cf53aaa11e9bce2f40f24344a08"} 71 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [1], "conds": [[2, 1, "300"], [0, 2, "000300.SH"]]}} 72 | {"sql_pred": {"agg": [0], "sel": [1], "conds": [[2, 2, "300.0"], [0, 2, "000300.SH"]], "cond_conn_op": 2}} 73 | {"question": "你好,能不能帮我查一下满足成分股300个或者代码为000300.SH的板块名称", "table": "4d251cf53aaa11e9bce2f40f24344a08"} 74 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [1], "conds": [[2, 1, "300"], [0, 2, "000300.SH"]]}} 75 | {"sql_pred": {"agg": [0], "sel": [1], "conds": [[2, 2, "300.0"], [0, 2, "000300.SH"]], "cond_conn_op": 2}} 76 | {"question": "今年第一周全国电影票房排名前十中有多少部电影是周票房超过两千万,或者是票房占比大于10%的,或者是平均每场不足10人次的", "table": "4d2a0a543aaa11e99ec0f40f24344a08"} 77 | {"sql_right": {"agg": [4], "cond_conn_op": 2, "sel": [0], "conds": [[1, 0, "2000"], [2, 0, "10"], [3, 0, "10"]]}} 78 | {"sql_pred": {"agg": [4], "sel": [0], "conds": [[1, 0, 2000], [2, 0, 10], [3, 1, 10]], "cond_conn_op": 2}} 79 | {"question": "你好,今年第1周全国电影票房排名前十中周票房大于2000万,或是票房占比大于10%,又或者是平均下来每场少于10人次的影片有几部你知道吗", "table": "4d2a0a543aaa11e99ec0f40f24344a08"} 80 | {"sql_right": {"agg": [4], "cond_conn_op": 2, "sel": [0], "conds": [[1, 0, "2000"], [2, 0, "10"], [3, 0, "10"]]}} 81 | {"sql_pred": {"agg": [4], "sel": [0], "conds": [[1, 0, 2000], [2, 0, 10], [3, 1, 10]], "cond_conn_op": 2}} 82 | {"question": "2017年每股收益大于1元而且2017股票收益比率小于20%的股票市盈率相对盈利增长比率为多少", "table": "01564d28351311e9ada4542696d6e445"} 83 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [12], "conds": [[3, 1, "1"], [7, 1, "20"]]}} 84 | {"sql_pred": {"agg": [0], "sel": [7], "conds": [[3, 0, 1], [6, 1, 20]], "cond_conn_op": 1}} 85 | {"question": "我想通过2017每股的收益超过1元以及股票市盈率低于20%来查询它的股票市盈率相对盈利增长比率", "table": "01564d28351311e9ada4542696d6e445"} 86 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [12], "conds": [[3, 1, "1"], [7, 1, "20"]]}} 87 | {"sql_pred": {"agg": [0], "sel": [7], "conds": [[4, 0, 1], [8, 1, 20]], "cond_conn_op": 1}} 88 | {"question": "了解到在17年股票每股盈余高于1元并且本益比不超过20,想问一下PEG是多少", "table": "01564d28351311e9ada4542696d6e445"} 89 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [12], "conds": [[3, 1, "1"], [7, 1, "20"]]}} 90 | {"sql_pred": {"agg": [0], "sel": [12], "conds": [[3, 0, 1], [6, 1, 20]], "cond_conn_op": 1}} 91 | {"question": "哪家公司的药品规格10ml:90mg或者产量在4400万只左右", "table": "43afd1e61d7111e9bddef40f24344a08"} 92 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [1], "conds": [[2, 2, "4,482"], [3, 2, "10ml:90mg"]]}} 93 | {"sql_pred": {"agg": [0], "sel": [1], "conds": [[3, 2, "10ml:90mg"], [2, 0, 44000000]], "cond_conn_op": 2}} 94 | {"question": "首付成数大于40或者每月还款额度减少额低于100的,在调整前月供为多少", "table": "c98c3e87332111e991c4542696d6e445"} 95 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [1], "conds": [[0, 0, "40"], [3, 0, "100"]]}} 96 | {"sql_pred": {"agg": [0], "sel": [1], "conds": [[0, 0, 40], [3, 1, 100]], "cond_conn_op": 2}} 97 | {"question": "月供在调整前达到多少才能使首付成数大于40或者每月还款额度减少额低于100", "table": "c98c3e87332111e991c4542696d6e445"} 98 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [1], "conds": [[0, 0, "40"], [3, 0, "100"]]}} 99 | {"sql_pred": {"agg": [0], "sel": [1], "conds": [[0, 0, 40], [3, 1, 100]], "cond_conn_op": 2}} 100 | {"question": "调息后,月供现在每月可少还额低于100的在调整前为多少或者首付成数大于40的调整前月供为多少", "table": "c98c3e87332111e991c4542696d6e445"} 101 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [1], "conds": [[0, 0, "40"], [3, 0, "100"]]}} 102 | {"sql_pred": {"agg": [0], "sel": [1], "conds": [[0, 0, 40], [3, 1, 100]], "cond_conn_op": 2}} 103 | {"question": "能给我就是说说都有哪些被动元器件制造公司其业务主要是电容啊,还有17年营收也超过了20亿的呀", "table": "0de5c761351311e989dc542696d6e445"} 104 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [0], "conds": [[5, 2, "电容"], [6, 0, "20"]]}} 105 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[5, 2, "电容"], [5, 0, 2000000000]], "cond_conn_op": 1}} 106 | {"question": "我想知道哪些公司17年营收就达到20以上的,而且啊主要业务是电容的啊", "table": "0de5c761351311e989dc542696d6e445"} 107 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [0], "conds": [[5, 2, "电容"], [6, 0, "20"]]}} 108 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[5, 0, 20], [5, 2, "电容"]], "cond_conn_op": 1}} 109 | {"question": "能就是帮我查查看都是哪些证券其归母利润大于30,或者营收同比增长率大于50的呀", "table": "0de680cf351311e9bde3542696d6e445"} 110 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [2], "conds": [[4, 0, "50"], [6, 0, "30"]]}} 111 | {"sql_pred": {"agg": [0], "sel": [2], "conds": [[5, 0, 30], [5, 0, 50]], "cond_conn_op": 2}} 112 | {"question": "市值超过300亿港币或者收益大于0.8的股票属于什么子行业", "table": "733d80fd34c611e98d98542696d6e445"} 113 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [3], "conds": [[8, 0, "300"], [11, 0, "0.8"]]}} 114 | {"sql_pred": {"agg": [0], "sel": [3], "conds": [[11, 0, "0.8"], [8, 1, 300]], "cond_conn_op": 2}} 115 | {"question": "你好,可不可以帮我查一下满足市值超过300亿港币或者收益大于0.8的股票,这些股票都是哪些行业的", "table": "733d80fd34c611e98d98542696d6e445"} 116 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [3], "conds": [[8, 0, "300"], [11, 0, "0.8"]]}} 117 | {"sql_pred": {"agg": [0, 0], "sel": [2, 3], "conds": [[9, 0, "0.8"], [8, 1, 300]], "cond_conn_op": 2}} 118 | {"question": "一共有几家公司估计18年和19年的市盈率都会超过百分之二十的呀", "table": "43b3612e1d7111e9a29bf40f24344a08"} 119 | {"sql_right": {"agg": [4], "cond_conn_op": 1, "sel": [1], "conds": [[6, 1, "20"], [7, 1, "20"]]}} 120 | {"sql_pred": {"agg": [4], "sel": [1], "conds": [[7, 0, 20], [6, 0, 20]], "cond_conn_op": 2}} 121 | {"question": "你好,你知道预计2018年,还有2019年的本益比都在百分之二十以上的公司有多少家吗", "table": "43b3612e1d7111e9a29bf40f24344a08"} 122 | {"sql_right": {"agg": [4], "cond_conn_op": 1, "sel": [1], "conds": [[6, 1, "20"], [7, 1, "20"]]}} 123 | {"sql_pred": {"agg": [4], "sel": [1], "conds": [[7, 0, 20], [6, 0, 20]], "cond_conn_op": 1}} 124 | {"question": "你帮我算一下18年,19年的股价收益比率估值都高于百分之二十的公司数量吧", "table": "43b3612e1d7111e9a29bf40f24344a08"} 125 | {"sql_right": {"agg": [4], "cond_conn_op": 1, "sel": [1], "conds": [[6, 1, "20"], [7, 1, "20"]]}} 126 | {"sql_pred": {"agg": [4], "sel": [1], "conds": [[7, 0, 20], [6, 0, 20]], "cond_conn_op": 1}} 127 | {"question": "滚动市盈率超120而且平均市净率超1.5的股票代码是什么", "table": "43b2932b1d7111e9a434f40f24344a08"} 128 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [0], "conds": [[3, 0, "120"], [4, 0, "1.5"]]}} 129 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[4, 0, "1.5"], [4, 0, 120]], "cond_conn_op": 1}} 130 | {"question": "诶,你知道有哪些股17年的PE大于10,PB也大于2的呀,那那这些股代码是什么啊", "table": "6e616aa834ce11e9a75a542696d6e445"} 131 | {"sql_right": {"agg": [0, 0], "cond_conn_op": 1, "sel": [0, 1], "conds": [[5, 0, "10"], [8, 0, "2"]]}} 132 | {"sql_pred": {"agg": [0, 0], "sel": [0, 1], "conds": [[8, 0, 2], [8, 0, 10]], "cond_conn_op": 1}} 133 | {"question": "学历为本科要求的岗位中,哪些招20多人?", "table": "abbf13ab3b0611e9a6d1f40f24344a08"} 134 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [2], "conds": [[3, 2, "本科"], [5, 0, "20"]]}} 135 | {"sql_pred": {"agg": [0], "sel": [2], "conds": [[3, 2, "本科"], [5, 2, "20.0"]], "cond_conn_op": 1}} 136 | {"question": "平峰期发车间隔不高于10分钟且高峰期发车间隔低于5分钟的有哪些公交线路呢", "table": "aa2d04213b0611e9b9f2f40f24344a08"} 137 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [2], "conds": [[8, 2, "不高于10分钟"], [7, 2, "低于5分钟"]]}} 138 | {"sql_pred": {"agg": [0], "sel": [2], "conds": [[7, 1, 10], [8, 1, 5]], "cond_conn_op": 1}} 139 | {"question": "那你说都有哪些公交路线的平峰期发车间隔不超过10分钟的和高峰期发车间隔低于5分钟的", "table": "aa2d04213b0611e9b9f2f40f24344a08"} 140 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [2], "conds": [[8, 2, "不高于10分钟"], [7, 2, "低于5分钟"]]}} 141 | {"sql_pred": {"agg": [0], "sel": [2], "conds": [[7, 1, 10], [8, 1, 5]], "cond_conn_op": 1}} 142 | {"question": "帮我找找有哪些路线的公交平峰期不超过10分钟一趟还有高峰期低于5分钟一趟的", "table": "aa2d04213b0611e9b9f2f40f24344a08"} 143 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [2], "conds": [[8, 2, "不高于10分钟"], [7, 2, "低于5分钟"]]}} 144 | {"sql_pred": {"agg": [0], "sel": [2], "conds": [[7, 1, 5], [9, 1, 10]], "cond_conn_op": 2}} 145 | {"question": "我想知道你们科研岗位1,2一起的话要招几个人啊", "table": "aa9713193b0611e9bf8ff40f24344a08"} 146 | {"sql_right": {"agg": [5], "cond_conn_op": 2, "sel": [3], "conds": [[1, 2, "科研岗位01"], [1, 2, "科研岗位02"]]}} 147 | {"sql_pred": {"agg": [5], "sel": [3], "conds": [[1, 2, "科研岗位12"], [0, 2, "2.0"]], "cond_conn_op": 1}} 148 | {"question": "什么时候的无锡镍价格高于100000以及伦敦镍价格低于15000", "table": "f399ffd1453d11e9aea6f40f24344a08"} 149 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [0], "conds": [[1, 0, "100000"], [2, 1, "15000"]]}} 150 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[2, 1, 15000], [2, 0, 100000]], "cond_conn_op": 1}} 151 | {"question": "我想知道职位空缺超过2个或者年工资大于40万的职位一共有多少个", "table": "f11b638f453d11e997def40f24344a08"} 152 | {"sql_right": {"agg": [4], "cond_conn_op": 2, "sel": [2], "conds": [[6, 0, "40"], [5, 0, "2"]]}} 153 | {"sql_pred": {"agg": [4], "sel": [2], "conds": [[6, 0, 40], [6, 0, 2]], "cond_conn_op": 2}} 154 | {"question": "预计在2016年1月1号到12月31号执行的项目门户网站内容更新保障和专题专栏建设服务的实施单位是哪一个", "table": "f25db4ee453d11e988a4f40f24344a08"} 155 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [1], "conds": [[5, 2, "2016.01.01-2016.12.31"], [2, 2, "门户网站内容更新保障和专题专栏建设服务"]]}} 156 | {"sql_pred": {"agg": [0], "sel": [1], "conds": [[2, 2, "2016年道路设施养护管理"], [2, 2, "门户网站内容更新保障和专题专栏建设服务"]], "cond_conn_op": 2}} 157 | {"question": "门户网站内容的更新保障和专题专栏的建设服务这个项目预计在2016年1月1号到12月31号这段期间执行,那么由哪个单位来实行呢", "table": "f25db4ee453d11e988a4f40f24344a08"} 158 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [1], "conds": [[5, 2, "2016.01.01-2016.12.31"], [2, 2, "门户网站内容更新保障和专题专栏建设服务"]]}} 159 | {"sql_pred": {"agg": [0], "sel": [1], "conds": [[2, 2, "2016年道路设施养护管理"], [2, 2, "门户网站内容更新保障和专题专栏建设服务"]], "cond_conn_op": 1}} 160 | {"question": "什么单位实施的项目是门户网站内容更新保障和专题专栏建设服务并且预计在2016年1月1号到12月31号执行", "table": "f25db4ee453d11e988a4f40f24344a08"} 161 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [1], "conds": [[5, 2, "2016.01.01-2016.12.31"], [2, 2, "门户网站内容更新保障和专题专栏建设服务"]]}} 162 | {"sql_pred": {"agg": [0], "sel": [1], "conds": [[2, 2, "2016年道路设施养护管理"], [2, 2, "门户网站内容更新保障和专题专栏建设服务"]], "cond_conn_op": 1}} 163 | {"question": "投稿很难(命中率约20%)或者审稿较慢,6-12周的期刊名是什么", "table": "aad6c1a33b0611e99b65f40f24344a08"} 164 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [0], "conds": [[7, 2, "很难(命中率约20%)"], [8, 2, "较慢,6-12周"]]}} 165 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[8, 2, "较慢,6-12周"], [6, 0, 20]], "cond_conn_op": 2}} 166 | {"question": "哪些期刊的投稿很难(命中率约20%)或者审稿较慢,6-12周", "table": "aad6c1a33b0611e99b65f40f24344a08"} 167 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [0], "conds": [[7, 2, "很难(命中率约20%)"], [8, 2, "较慢,6-12周"]]}} 168 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[8, 2, "较慢,6-12周"], [6, 0, 20]], "cond_conn_op": 2}} 169 | {"question": "你知道投稿很难(命中率约20%)或者审稿较慢,6-12周的期刊都有哪些吗", "table": "aad6c1a33b0611e99b65f40f24344a08"} 170 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [0], "conds": [[7, 2, "很难(命中率约20%)"], [8, 2, "较慢,6-12周"]]}} 171 | {"sql_pred": {"agg": [0], "sel": [0], "conds": [[8, 2, "较慢,6-12周"], [9, 0, 20]], "cond_conn_op": 2}} 172 | {"question": "初一的欢乐寒假定价是多少啊?", "table": "abac4db03b0611e99a64f40f24344a08"} 173 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [5], "conds": [[0, 2, "七年级"], [3, 2, "欢乐寒假"]]}} 174 | {"sql_pred": {"agg": [0], "sel": [5], "conds": [[3, 2, "初中升学考试复习方略"], [3, 2, "欢乐寒假"]], "cond_conn_op": 1}} 175 | {"question": "买一本初一的欢乐寒假要花多少钱?", "table": "abac4db03b0611e99a64f40f24344a08"} 176 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [5], "conds": [[0, 2, "七年级"], [3, 2, "欢乐寒假"]]}} 177 | {"sql_pred": {"agg": [0], "sel": [5], "conds": [[3, 2, "初中升学考试复习方略"], [3, 2, "欢乐寒假"]], "cond_conn_op": 1}} 178 | {"question": "你知道欢乐寒假(初一)是卖多少钱一本吗?", "table": "abac4db03b0611e99a64f40f24344a08"} 179 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [5], "conds": [[0, 2, "七年级"], [3, 2, "欢乐寒假"]]}} 180 | {"sql_pred": {"agg": [0], "sel": [5], "conds": [[3, 2, "初中升学考试复习方略"], [3, 2, "欢乐寒假"]], "cond_conn_op": 1}} 181 | {"question": "我想知道目前这个需要培训三周的高级企业管理项目有多少人参加来着", "table": "a95fd8573b0611e98ba2f40f24344a08"} 182 | {"sql_right": {"agg": [0], "cond_conn_op": 1, "sel": [5], "conds": [[2, 2, "高级企业管理"], [4, 2, "3周"]]}} 183 | {"sql_pred": {"agg": [0], "sel": [5], "conds": [[2, 2, "企业高级管理人员培训项目"], [2, 2, "农业管理培训项目"]], "cond_conn_op": 1}} 184 | {"question": "估定价格高于50块或者国际标准书号为978-7-111-58427-8的书有哪些", "table": "aa4fbab03b0611e999fef40f24344a08"} 185 | {"sql_right": {"agg": [0], "cond_conn_op": 2, "sel": [3], "conds": [[9, 0, "50"], [10, 2, "978-7-111-58427-8"]]}} 186 | {"sql_pred": {"agg": [0], "sel": [3], "conds": [[10, 0, 50], [10, 2, "978-7-111-58427-8"]], "cond_conn_op": 2}} 187 | -------------------------------------------------------------------------------- /data/prepare_data/col_in_text: -------------------------------------------------------------------------------- 1 | 水泥行业有哪些地区今年时长是4个月或者去年时长是4个月的? 2 | 请问今年时长是4个月或者去年时长是4个月的水泥行业地区有哪些? 3 | 我想知道今年时长是4个月或者去年时长是4个月的水泥行业地区有哪些? 4 | 起点为上海虹桥或者终点为上海虹桥的高铁线路里程是多少 5 | 你知道起点为上海虹桥或者终点为上海虹桥的高铁线路里程吗 6 | 高铁线路里程多少时它的起点为上海虹桥或者终点为上海虹桥 7 | 主管部门是农业部或者项目承担单位为农业部草原监理中心的项目任务是什么 8 | 哪些项目任务的主管部门是农业部或者项目承担单位为农业部草原监理中心 9 | 你可以告诉我主管部门是农业部或者项目承担单位为农业部草原监理中心的项目任务吗 10 | 那个我刚研究生毕业想问问就是什么职位要求是研究生学历的呢 11 | 学位是硕士或者学历为 研究生(硕士)及以上或者中文、汉语言文学、新闻学专业的职位代码是什么 12 | 哪些职位代码的学位是硕士或者学历为 研究生(硕士)及以上或者要求中文、汉语言文学、新闻学专业 13 | 学位是硕士或者学历为 研究生(硕士)及以上或者要求中文、汉语言文学、新闻学专业的职位代码都有哪些 14 | 已知本部排球场周一至周日全天开放或者本部网球场全天开放,那么本部田径场什么时候开放 15 | 本部田径场什么时候开放的场馆本部排球场周一至周日全天开放或者本部网球场全天开放 16 | 是这样,场馆本部排球场周一至周日全天开放或者本部网球场全天开放,但是我想问一下本部田径场的开放时间 17 | 你能不能告诉我招研究员的都是什么部门呀,还有这些部门的研究员岗位编号多少你知道吗 18 | 你好,那些说要招研究员的都是啥部门来着,还有这些研究员岗位编号都给我一下呗 19 | 产品等级为合格品并且抽查结果为合格的产品有哪些? 20 | 你知道有哪些产品等级为合格品并且抽查结果为合格的吗? 21 | 请问产品等级为合格品并且抽查结果为合格的产品有哪些? 22 | 招录机关是中共菏泽市委市直机关工作委员会或者用人单位是机关的报录职位有多少 23 | 有多少报录职位的招录机关是中共菏泽市委市直机关工作委员会或者用人单位是机关 24 | 你知道招录机关是中共菏泽市委市直机关工作委员会或者用人单位是机关的报录职位有几个吗 25 | 哪些用人司局的机构性质是中央国家行政机关及其直属机构或者机构层级为中央 26 | 型号规格等级是165/88A170/92A合格品或者报告结论是合格的(标称)生产单位名称是什么 27 | 哪些(标称)生产单位名称的型号规格等级是165/88A170/92A合格品或者报告结论是合格 28 | 专业不限,或者是政治面貌不限的职位有哪些啊 -------------------------------------------------------------------------------- /data/prepare_data/new_q_exactly_match: -------------------------------------------------------------------------------- 1 | 那个2011年每股盈余大于1元的都是什么股啊,其代码是什么啊 2 | 我想知道就是哪些股11年的每股收益超过1块的,那股票代码是什么啊 3 | 请问在6月17日最新股价超过1并且最新市值达到20亿港币的证券都有哪些? 4 | 有哪些电影公司在2018年票房超过20亿并且影院数量超过300的? 5 | 麻烦请告知在2018年票房达到20亿以上同时影院数量多于300间的都有哪些电影公司? 6 | 你知道有哪些电影公司在2018年票房是高于20亿而且影院的数量达到300间以上? 7 | 5月均价低于24000或者月环比涨幅低于4的楼盘名称是什么 8 | 请问一下哪个楼盘名称的5月平均价格小于24000而且月环比涨幅小于4的 9 | 想要了解一下5月平均价格小于24000而且月环比涨幅小于4的楼盘 10 | 2011年平均市净率大于2%的股票其重估净资产是多少,P/R-V又是多少 11 | 2018年三季报传媒个股商誉B净资产小于20亿而且净利润小于1000亿的证券代码B是多少 12 | 你知道2018年三季报传媒个股商誉B净资产小于20亿而且净利润小于1000亿的证券代码B吗 13 | 最新收盘价低于5.1股的证券有多少啊? 14 | 哪些公司11年的EPS小于1,或者PE小于20的呀 15 | 诶,你知道就是有哪些公司11年的时候其市盈率低于20,或者每股的盈余低于1的呀 16 | 你好啊,那个11年每股盈余小于1的都是什么公司啊,还有他的市盈率低于20的公司呢 17 | 最新净资产超过3.1股的股票股价是多少,市值又是多少 18 | 哪些股票的2011A每股收益大于1块,代码是多少 19 | 2011A每股收益大于1块的股票都有哪些,所对应的股票代码为多少 20 | 你好,我想问一下2011A每股收益大于1块股票代码和名称,谢谢 21 | 当前股价大于50.1股的证券,其代码是什么 22 | 你好,我想咨询一下就是现在11月份快递业务量揽收达到1亿件以上,同时业务营收额高于20亿的都有哪些快递公司? 23 | 2017年本益比大于50%或者每股收益大于1块的股票当前的股价为多少 24 | 当前股价多少的股票2017年本益比大于50%或者每股收益大于1块 25 | 你知道2017年本益比大于50%或者每股收益大于1块的股票的当前股价吗 26 | 2012年5月均价大于20000.1平的楼盘月环比涨幅是多少 27 | 想要了解一下2012年5月房价平均下来的话超过20000.1平的广州楼盘他的月环比的涨幅情况 28 | 2017股息率大于7%而且分红比例低于60%的标的为多少 29 | 港口股息率领先标的达到了多少,已知2017年分红比例低于60%以及股息率大于7% 30 | 是这样的,我想知道2017年股息率超过7%的港口股标的并且分红比例是不足60%的 31 | 2018年的票房大于2亿的院线是哪个 32 | 请问哪个电影院线他的那个2018年电影的票房超过2亿的 33 | 想要知道2018年的那个电影的票房大于2亿的院线是哪个 34 | 二线城市去化时间2011年H1不足20个月或者H2不足10个月,那去年同期去化时间是多久 35 | 二线城市去化时间去年同期都多久啊,2011年的是H1不足20个月或者H2不足10个月 36 | 这周有哪些影投公司的票房超过1500万并且观影达到50万人次以上的? 37 | 你好,请告诉我这周票房高于1500万同时观影人次多于50万的影投公司谢谢。 38 | 第52周有哪些影投公司的票房达到1500万以上而且观影超过50万人次? 39 | 2011年市盈率大于15%,并且市净率估值大于1%的公司一共有多少? 40 | 请问总共有几个11年PE高于15%,PB估值也高于1%的公司? 41 | 麻烦问一下11年本益比超过15%,平均市净率估值还超过1%的公司数量? 42 | 2019年2月7日收视率小于1%的电视剧总共有多少部? 43 | 请问一下一共有多少部电视剧在2019年2月7日收视率小于1%的? 44 | 麻烦帮我查查一共有多少部电视剧在2019年2月7日收视率小于1%的? 45 | 成交均价大于500或者平均溢价率大于0的成交规划建筑面积是多少 46 | 你能不能告诉我成交均价大于500或者平均溢价率大于0的成交规划建筑面积 47 | 住宅土地市场交易成交规划建筑面积是多少啊,它的成交均价是大于500的或者平均溢价率大于0 48 | 2012年6月银河地产有哪些模拟组合的持股数量是超过100万股并且最新市价有2百万以上的? 49 | 银河地产在2012年6月10日中,模拟组合里持股数量大于100万股和最新市场价格达到有2百万以上的有哪些? 50 | 请问在2012年6月10日这个时间段,银河地产里持股数量高于100万股并且最新的市价超过2百万以上的模拟组合有哪些? 51 | 2019年第2周哪些影投公司的观影的人次大于20万或者场均的人次小于10 52 | 请问一下2019年的第2周看电影的人次超过200000或每场的平均人次低于10的公司有哪些 53 | 2017YOY大于20并且2018EYOY大于10的公司有哪些? 54 | 有哪些公司2017YOY大于20并且2018EYOY大于10的? 55 | 请问有哪些公司2017YOY大于20并且2018EYOY大于10的? 56 | 当前股价11/18高于10块而且同比涨跌大于了0,这是哪些股票 57 | 哪些股票的同比涨跌大于了0以及11月18号的股价超过了10块 58 | 帅哥,帮我查查股价超过10块且同比涨跌比0大的股票名称呗,谢谢 59 | 2010年5月累计超过20并且2012年5月累计超过10的住宅房总共有多少? 60 | 总共有多少住宅房在2010年5月累计超过20并且2012年5月累计超过10的? 61 | 请问一共有多少住宅房在2010年5月累计超过20并且2012年5月累计超过10的? 62 | 想知道有几家公司2018年的本益比预计是高于20的 63 | 哪些股票的市值超过20亿或者涨跌幅小于0 64 | 涨跌幅低于0或者市值超过了20亿的股票有哪些 65 | 有没有市值高于20亿或者涨跌幅不足0的股票 66 | 2012年第一季度平均市净率大于2%的股票所对应的最大股价是多少 67 | 股价在什么范围内的股票2012年第一季度的平均市净率大于2%,其中股价上限是多少 68 | 你知道2012年第一季度平均市净率大于2%的股票股价最大值吗 69 | 在18年10月份快递上市公司业务量大于2亿件而且快递业务营收大于12亿的公司是哪个 70 | 请问2018年10月哪些快递公司的业务量是超过2亿同时快递营业收入也超过12亿的 71 | 有哪些快递公司在10月份的时候快递的营业收入达到12亿以上并且他的业务量是超过2亿 72 | 2009年可售面积最高点高于200,在2010最高也在300以上,想问一下2011年最高达到多少 73 | 2015年港口股息率低于2%,那同年分红比例达到了多少 74 | 2015年港口股分红比例是多少啊,它的股息率是超过2%的 75 | 2015年资本支出超过1亿的证券是哪个以及他在2016年的时候资本支出情况如何 76 | 资本支出15年超过1亿的是哪个证券,该证券16年的资本支出多少 77 | 请问15年资本支出达到1亿以上的是什么证券,其16年有多少资本支出 78 | 2018年票房超过20亿的院线公司有哪些,它的相关上市公司是什么公司 79 | 你好,请问2018年电影的票房大于20亿的电影院线及其相关的上市公司分别都有哪些啊 80 | 单周票房多少的电影,他的人均的场次低于10,但是上映时间在十天以上的 81 | 2017年第一季度的季度营收同比增速小于100%或者2017年第二季度的大于0,那么第三季度的是多少 82 | 已知2017年第一季度的季度营收同比增速小于100%或者2017年第二季度的大于0,可以查询第三季度的营收同比增速吗 83 | 你知道2017年第一季度的季度营收同比增速小于100%或者2017年第二季度大于0所对应的第三季度营收同比增速吗 84 | 有几家公司11年每股收益小于1元,而且市盈率小于20倍的呀 85 | 你帮我看看有多少家公司2011年每股盈余低于1块,本益比不超过20倍的呀 86 | 那个11年市价盈利比率低于20倍,并且每股税后利润小于1块钱的公司共有几家呀 87 | 这一周新房成交超100000平,超一百套的城市有哪些 88 | 诶,你知道17年每股盈余小于1,并且市盈率小于60的有几个电子股票啊 89 | 就是17年有几个电子股的每股盈余会低于1,而且是市盈率低于60的呀 90 | 查查看就是17年每股收益少于1的,市盈率又低于60的有几种股是 91 | 2018年票房大于7亿元并且影院数量大于20个的影投公司有哪些? 92 | 有哪些影投公司2018年票房大于7亿元并且影院数量大于20个的? 93 | 请问一下有哪些影投公司2018年票房大于7亿元并且影院数量大于20个的? 94 | 95 | ((Apr)不等于3)时间是多少 96 | 2011每股收益不足1块的股票属于哪些公司,代码是多少 97 | 哪些公司的股票在2011年每一股收益还没有1块,那他们这些公司的代码是什么 98 | 嘿,你好,这边咨询一下在11年每股盈余低于1块的公司名字以及公司代码 99 | 2012年1-5月全国房地产开发绝对量超过6000或者同比增长大于0的指标是什么来着 100 | 现在是知道了同比增长大于0或者绝对量超6000,那指标是如何定的 101 | 告诉我指标就行了,绝对量超过6000或者是同比增长大于0这些我都是知道的 102 | 高铁二等座票价大于500元或者航空经济舱票价大于1500元的两地距离最短是多少 103 | 当距离最小为多少时高铁二等座票价大于500元或者航空经济舱票价大于1500元 104 | 你知道高铁二等座票价大于500元或者航空经济舱票价大于1500元的最短距离是多少吗 105 | 2018Q3营收同比增速大于8%或2018Q3净利润同比增速大于10%的证券股份有哪些? 106 | 有哪些证券股份2018Q3营收同比增速大于8%或2018Q3净利润同比增速大于10%的? 107 | 请问一下有哪些证券股份2018Q3营收同比增速大于8%或2018Q3净利润同比增速大于10%的? 108 | 2011年月均月成交价格超过10000而且同比增长超过20%的城市是哪个 109 | 有没有什么城市2011年月均月成交价格达到10000以上还有就是同比增长达到20%以上 110 | 请问2011年月均月成交价格高于10000的城市当中有哪个城市同比增长还超过20% 111 | 2011年的市净率高于3倍,或者市盈率低于20倍的公司它们的总市值分别是多少啊 112 | 2018每股收益超过1块或者本益比超过20%的公司有几个 113 | 有几个公司的2018股票收益比率超过20%或者股价超过1元的 114 | 你能帮我查一下2018每股收益高于1块或本益比有20%以上的公司有多少个吗,谢谢 115 | 2012年1-5月全国房地产开发同比增长超过20%的绝对量是多少 116 | 2011同期大于100并且2012至今大于20的累计同比最大是多少? 117 | 请问一下2011同期大于100并且2012至今大于20的累计同比最大是多少? 118 | 麻烦帮我算算2011同期大于100并且2012至今大于20的累计同比最大是多少? 119 | 2012年1-5月全国房地产开发同比增长大于0的绝对量和指标情况分别是什么 120 | 成交套数同比11年和10年都为负,具体是哪几个城市 121 | 市占率大于35%或者同比小于20%,那么2018年的单量和份额为多少 122 | 2018年的单量和份额为多少时,满足市占率大于35%或者同比小于20% 123 | 股票PB估值大于2,想知道它的EPS2012E和PE2012E是多少 124 | 我了解到股票的平均市净率已超过了2,这个EPS2012E和这个PE2012E数值能查询出来么 125 | 请问EPS2012E和这个PE2012E是多少啊,它平均的市净率估值已高于2 126 | 预计18年的每股收益低于1元或者本益比小于20%的股票收盘价是多少 127 | 18年EPS估值不足1元的股票收盘价是多少或者18年的PE低于20%的收盘价是多少 128 | 有没有18年市盈率估值小于20%或者18年的每股收益估值低于1元的股票,有的话这些股票的收盘价是多少 129 | 麻烦请告知19年第7周周票房达到70万以上同时观影超过1万人次的电影院谢谢。 130 | 本周成交不足20或者周均成交同比小于0的城市有哪几个 131 | 有没有周均成交同比小于0或者本周成交不足20的城市,有几个嘞 132 | 那些满足周均成交同比小于0或者本周成交不足20的城市有几个 133 | 哪些股13年的市盈率达到1倍以上的呀 134 | 你帮我查一下2013年什么公司的股票本益比超过1倍的呀 135 | 你知道股票低于10.1股的公司有多少家吗 136 | 2017年市场占有率大于1并且除税的收入大于5亿元的混凝土外加剂公司有哪些 137 | 17年我国有哪些混凝土外加剂公司它的市场份额超过1同时销售的收入不包含税的情况下高于5亿元 138 | 你知道中国在17年的时候,有哪些公司生产的混凝土外加剂市场的占有率是大于1而且不含税的销售额超过5 139 | 我想问股价高于20的那些公司在2020年的时候每股收益预计会有多少,还有啊都是什么公司 140 | 诶,你知道总共有几家影投公司18年票房达8亿以上吗 141 | 你帮我数数都有几家那个影投公司18年的时候票房超过8亿啊 142 | 我想知道就是现在有几家那个符合成立电影院线公司条件的影投公司18年的票房达到8亿以上的呀 143 | 2012年2月,3月以及4月成交量环比分别大于20%,50%和-9%的城市总的有几个 144 | 有几个城市2012年4月成交量环比大于-9%而且3月成交量环比大于50%以及2月成交量环比大于20% 145 | 2012年有没有2月,3月以及4月成交量环比分别大于20%,50%和-9%的城市,有的话,像这样的城市一共有几个 146 | 股票2011年每股收益大于1块或者本益比大于15%,那么同年的平均市净率为多少 147 | 2011年股票的平均市净率是多少啊,已知它的每股收益大于1块或者本益比大于15% 148 | 你知道2011年每股收益大于1块或者本益比大于15%的股票的平均市净率吗 149 | 请问在2012年支出资本在10亿以上,而且2013年也支出超过20亿资本的证券都有哪些? 150 | 电子产业股票2018E本益比大于20%,其每股收益为多少 151 | 你知道电子产业2018E股票收益比率超过20%的股票每股收益多少吗 152 | 哎,你好,那个我问一下2018E股票收益比率超过20%的电子产业股票每股收益是多少啊 153 | 哪些电影在2019年第7周一周的票房大于2亿或者场均人次大于10的 154 | 成交超过5宗并且楼面价格大于250或者成交面积大于20的城市有哪些? 155 | 有哪些城市成交宗数大于5并且楼面价大于250或者成交面积大于20的? 156 | 请问一下有哪些城市成交高于5宗以及楼面价格大于250或者成交的面积是超过20的? 157 | 2012年5月上海哪个楼盘均价大于20000每平而且楼盘容积率大于1 158 | 2011年周均成交大于20,那消化时间多久,备注也就是什么类型的房产 159 | 2011年周均成交大于20的是哪个类型的房产,消化时间分别是多少周 160 | 您好,帅哥,问一下2011年周均成交大于20的备注额也就是房地产类型以及它的消化时间 161 | 2018年1月到11月飞机起降大于40万架次而且起降同比大于2的机场是哪个 162 | 请问一下啊2018年1月到11月飞机起降超过40万架次而且起降同比超2的机场有吗有的话是哪个 163 | 想要知道2018年1月到11月飞机起降超过40万架次而且起降同比超2的机场 164 | 2011年每股收益小于1块或者本益比低于20%的股票的PB估值是多少 165 | 你好,2011年的市盈率不足20%或者每股盈余也是小于1块钱的股票其平均市净率估计会是多少 166 | 11年股票的EPS还没有1块或者PE不足20个百分比,这样的股票平均市净率估值可以达到多少 167 | 2012年累计同比变动大于0的城市有哪些 168 | 2017年股息率大于0或者平均市净率大于1的股票评级是什么 169 | 如何对平均市净率大于1或者2017年股息率大于0的股票进行评级 170 | 能不能问一下2017年股息率大于0或者平均市净率大于1的股票评级 171 | 我国特高压建设输电线路为2100公里或工程投资超过100亿的项目有哪些? 172 | 你知道有哪些项目特高压建设输电线路为2100公里或工程投资100亿以上的吗? 173 | 麻烦告诉我,特高压建设输电线路为2100公里或工程投资大于100亿的项目有哪些? 174 | 月环比的涨幅大于7而且5月份均价大于37000的楼盘是哪个 175 | 那些预计2018年的EPS大于1,或是PE大于20的航空公司中市值最大的是多少 176 | 你知道这些估计18年的每股盈余高于1,或者市盈率高于20的公司的最高市值吗 177 | 你帮我看一下那些18年的每股收益估值超过1元,或者是18年的本益比估值超过20的航空公司它们的市值最高的是多少来着 178 | EPS2013E大于1而且PE2011大于9的证券代码是什么 179 | 请问一下哪个证券代码的EPS2013E超过1而且PE2011超过9 180 | 想要知道PE2011超过9而且EPS2013E超过1的证券代码 181 | 周涨跌幅大于0并且总市值大于10亿的股票简称是什么 182 | 想问一下有周涨跌幅大于0并且总市值大于10亿的股票简称吗 183 | 哪个市值超10亿的股票代码周涨跌幅大于0 184 | 17年每股收益大于0而且市盈率大于20%的股票中最小股价为多少 185 | 你好,17年每股收益大于0而且市盈率大于20%的股中最低的是每股多少钱啊 186 | 你知道17年每股都有收益而且PE还大于20%的股票股价最小值是多少吗 187 | 一共有多少家公司13年的市盈率是超过1块钱的 188 | 我想知道13年市价盈利比率在1块以上的公司共有几家 189 | 13年有多少只股票本益比高于1元的 190 | 持有股份大于100并且最新市价大于1千万元的地产证券一共有多少个? 191 | 一共有多少个地产证券持股数量大于100并且最新市价大于1千万元的? 192 | 麻烦帮我看看持股数量大于100以及最新市价大于1千万元的地产证券一共有多少个? 193 | 请问有哪些PCB公司在2014年总收入超过了20亿的?那在2015年达到多少? 194 | 麻烦请告知在2014年总收入高于20亿以上的PCB公司还有它在2015年的总收入谢谢。 195 | 股价大于18.1股的公司简称是什么 196 | 请问超过8000.1平的位置在哪里,还有就是叫什么项目 197 | 2017年股票每股收益不足2块而且本益比低于10%的公司有几个 198 | 有几个公司的股票2017年本益比是不足10%的并且每股收益还没有2块 199 | 你好,有没有2017年的股票每股收益不足2块而且本益比低于10%的公司,这样的公司总的有几个 200 | 我想知道几线城市在2012年3月成交量环比是高于50并且在同年2月份中成交量环比是超过20的? 201 | 请问在2012年3月成交量环比大于50和2月份中成交量环比在20以上的城市有哪些? 202 | 请问一下股票交易的价格超过26.1股,那都是哪些证券代码 203 | 二手房销售套数年度周动均态大于500或者销售套数环比大于0在05.27-06.02期间的销售套数总和是多少 204 | 全国房地产开发绝对量低于2000或者同比增长大于0的指标是什么 205 | 哪种指标的绝对量低于2000或者同比增长大于0 206 | 你知道绝对量低于2000或者同比增长大于0说的是哪个指标吗 207 | 股价超过10块钱或者溢价率为负数的股票市值多少 208 | 你好,帮我查询一下溢价率小于0或者股价高于10块钱的股票市值,谢谢 209 | 我想知道股票市值,它的股价超过了10块或者溢价率是不足0的 210 | 股价超过20块,那么2018E股票的本益比以及每股收益分别为多少 211 | 你好,能不能帮我查一下股价超过20块的2018E股票的本益比和每股收益 212 | 2018E股票的本益比以及每股收益分别为多少时可使股价高于20块 213 | 盈利增长率19E或者盈利增长率18E都为负值时,我很好奇20E盈利增长率的情况是啥样 214 | 2012年1-5月全国房地产开发的绝对量低于10000或者同比增长低于20%的指标是什么 215 | 2012年1-5月全国房地产开发同比增长不足20%的指标如何或者是绝对量低于10000的指标 216 | 2012年1-5月全国房地产开发的指标具体是什么情况,它的绝对量是低于10000或者同比增长是不足20个百分点的 217 | 2019E每股收益小于1块的股票所对应的本益比是多少 218 | 已知每股收益是不足1元的,那么2019E股票收益比率为多少 219 | 倒挂率大于25而且最新收盘价大于5的证券代码是什么 220 | 想要了解的是股票倒挂率超过25并且最新的收盘价超过5的证券代码 221 | 请问一下哪个证券代码它最新收市价是超过5而且价格倒挂达到了25以上 222 | 你知道现价低于10块而且2019E本益比小于20%的股票评级吗 223 | 怎么对现价低于10块而且2019E本益比小于20%的股票进行评级 224 | 那个,就是2019E股票每股收益低于20%并且现价低于10块的股票,都是怎么评级的 225 | 2010年05月大于10并且2011年05月大于15的名称总共有多少? 226 | 总共有多少2010年05月大于10并且2011年05月大于15的住宅房? 227 | 你好,请问总共有多少2010年05月大于10并且2011年05月大于15的住宅房? 228 | 哪些院线公司的18年票房超过8亿或者单银幕票房超过100万 229 | 2018年电影总票房大于8亿或单银幕票房大于100万的院线叫什么 230 | 你好,请问2018年电影票房高于8亿,或者说单银幕的票房高于100万的电影院线都有哪些 231 | 在17年每股收益大于1块以及股票收益比率大于20%的股票,请给一些投资建议 232 | 2017年本益比超过20%而且每股盈余大于1块的股票该如何投资评级 233 | 那些17年股票每股的收益高于1元且股票市盈率大于20%的股票,投资评级情况怎样 234 | 本益比大于3%或者2017年净资产收益率大于20%的股票有哪些 235 | 哪些股票的2017年净资产收益率大于20%或者股票收益比率超过3% 236 | 本益比大于3%或者2017年净资产收益率超过20%指的是哪些股票 237 | 哪些股票2018E每股收益小于1块,代码是多少 238 | 2018E每股收益小于1块的股票有哪些,它的代码是什么 239 | 你知道2018E每股收益小于1块的证券简称和证券代码吗 240 | 如何对2018E每股收益大于1块或者2018E本益比大于20%的股票进行评级 241 | 2018E的股票收益比率大于20%或者每股收益超过1块的股票评级是什么 242 | 像2018E每股收益大于1块或者2018E本益比大于20%这样的股票是怎么评级的 243 | 有没有哪个城市2019年高点大于15低点大于5 244 | 请问一下在2019年高点在15以上低点在5以上的城市是哪个 245 | 我就是想查询一下哪个城市09年低点大于5高点大于15 246 | 那个17年每股盈余大于1的是哪些股来着,还有啊那18年的EPS估值是多少啊 247 | 就是有哪些股17年EPS是大于1的呀,那预估18年的EPS是多少啊 248 | 我想问就是17年EPS大于1都是什么股啊,那18年的EPS预计是多少啊 249 | 2011年股票本益比大于20%,或者每股收益大于1块的股票是怎么评级的 250 | 你跟我说说11年的市盈率超过20%,或是每股盈余超过1元的那些股是否适合买入 251 | 那些在11年的时候EPS就高于1,或者是PE高于20%的股票我应该卖出吗 252 | 哪些股票11年每股收益超过了1元 253 | 2011年每股盈余高于1块的是什么股票 254 | 想知道哪些公司11年每股税后利润超过1块钱一股 255 | 有几家公司预计12年的每股盈余低于1元钱,市盈率也低于20倍的呀 256 | 我想问问你啊就是目前预计2012年的每股收益少于1块,本益比也小于20倍的公司有多少家呀 257 | 诶,你帮我算一下12年市价盈利比率估值在20倍以下,每股税后利润估值也在1块钱以下的公司数量 258 | 2017A每股收益大于1块或者本益比大于20%的重点公司有几个 259 | 运输业重要公司有几个的2017A每股收益是大于1块的或者股票收益比率超过20% 260 | 运输业重要公司中,有没有2017A每股收益大于1块或者本益比大于20%的的公司啊,有的话,占了多少个 261 | 累计客座率大于80%并且累计客座率同比增减大于0%的航空公司总共有多少家? 262 | 总共有多少家航空公司累计客座率大于80%并且累计客座率同比增减大于0%的? 263 | 请问帮我查询一下累计客座率大于80%并且累计客座率同比增减大于0%的航空公司总共有多少家? 264 | 2011年每股收益大于1块或者本益比大于20%的股票评级是什么 265 | 如何对2011年每股收益大于1块或者本益比大于20%的股票进行评级 266 | 你知道2011年每股收益大于1块或者本益比大于20%的股票评级吗 267 | 2012年哪些城市日均成交超过了20万平,怎么备注的 268 | 2012年平均每天成交超过20万平的城市有哪些,都备注了什么 269 | 哪些城市的房产销量上周超过了2000或者上上周环比大于0 270 | 房产销量上周超过2000或者上上周环比大于0的城市有哪些 271 | 有没有房产销量上周超过2000或者上上周环比大于0的城市 272 | 你知道2011年股票平均市净率高于2倍的公司叫啥名吗 273 | 2012年日均成交大于2的西部城市是哪个 274 | 能不能查一下2012年的时候哪个西部城市每日平均成交大于2啊 275 | 我就是想查一下吧,2012年的日均成交,有没有城市是超过2的,具体是哪个城市 276 | 你知道交运行业里有哪些股票在上一周指数大于2000,同时涨跌幅不超过的吗? 277 | 哪些影片19年第7周的周票房超过1亿的呀 278 | 2019年2月18到2月24号的电影票房大于1亿的电影是什么啊 279 | 有哪些影院19年的第七周就超过1万人次观影,周票房达到80万以上,还有平均每场都有30人次以上的? 280 | 2017年LED显示屏营收超过30亿或者同比增速大于0的公司有哪些 281 | 哪些公司的LED显示屏营收同比增速大于0或者17年营收超过了30亿的 282 | 有没有LED显示屏营收同比增速大于0或者17年营收超过了30亿的公司,叫啥名啊 283 | 你知道2013年每股收益在2块钱以下,本益比也小于8倍的公司有几家吗 284 | 请问有没有什么城市租赁收入达到50000000以上而且物业面积也在五十万方以上的 285 | 2019E每股收益大于1块或者2019E股票收益比率大于20%的股票评级是什么 286 | 如何对2019E每股收益超过1块或者2019E股票收益比率超过20%的股票进行评级的 287 | 我很好奇2019E每股收益大于1块或者本益比超过20%的股票的评级 288 | 2017年中国有哪些市场占有率大于2的混凝土外加剂公司 289 | 2018年三季报传媒个股商誉A超过10亿元并且净资产大于20的证券有哪些? 290 | 麻烦请问一下2018年三季报传媒个股商誉A超过10亿元并且净资产大于20的证券有哪些呢? 291 | hello,这个2018年三季报传媒个股商誉A超过10亿元并且净资产大于20的证券有哪些? 292 | 本周跌幅后10大于0的股票最新市值一共多少钱 293 | 那些本周跌幅后10大于0的股票最新市值总和达到多少 294 | 你好,我想知道本周跌幅后10大于0的所有股票的最新市值加起来总的有多少钱 295 | 2017E每股收益2016A不足1块钱或者2017E市盈率低于20的有哪些公司 296 | 哪些公司的2017E市盈率没有超过20过着2017E每股收益2016A不足1块钱 297 | 2017E每股收益2016A不足1块钱的公司或者说是2017E市盈率低于20的公司是哪几个 298 | 我想了解2012年1-5月房地产的一些相关情况,并且请告诉我绝对量超过1000和同比增长大于20%的指标有哪些?谢谢 299 | 帮我查一下2012年1-5月的房地产信息中有哪些指标是绝对量于是高于1000并且同比增长大于20%的 300 | 2010年高点超过20的城市是哪个,他当年的低点是多少 301 | 请问有没有哪个城市在2010年时候高点在20以上,对应的2010年低点是多少 302 | 交运子板块本周指数超过4000或者本周涨跌幅小于0的股票代码有哪些 303 | 我想查询一下股票代码就是在本周指数超过了4000或者涨跌幅小于0的股票 304 | 总市值大于100亿或者滚动市盈率大于0的股票本周最低收盘价为多少 305 | 市值超过100亿,或者是滚动市盈率大于0的股票这周收盘价最低的是多少钱啊 306 | 你知道滚动本益比大于0,或是市值达到100以上的那些股票这一周的收盘价格最低多少吗 307 | 你知道2019年第7周有哪些电影票房是超过1亿并且票房占比达到3%以上的吗? 308 | 麻烦请说一下在2019年2月18到2月24的时候票房高于1亿而且占比在3%以上的电影谢谢 309 | 在2018年顺丰和韵达公司单量和份额中,韵达同比不足30%或者顺丰同比低于了20%发生在几月份 310 | 成交面积累计同比大于0,可否查询2012至今成交面积以及2011年同期成交面积 311 | 2011年同期成交面积和2012至今成交面积分别为多少时成交面积累计同比大于0 312 | 在成交面积累计同比大于0的情况下,2011年同期和2012年至今分别成交的土地面积有多少 313 | 自有船数大于0并且新船订单数大于10的公司总共有多少? 314 | 总共有多少公司自有船数大于0并且新船订单数大于10的? 315 | 请问帮我查询一下自有船数大于0并且新船订单数大于10的公司总共有多少? 316 | 2018年票房大于1亿或者2018年底银幕数量大于200的院线平均单银幕票房是多少 317 | 你知道2018年票房超过1亿或者2018年底银幕数量超过200的院线单银幕票房均值是多少吗 318 | 单银幕票房均值为多少时院线2018年票房超过1亿以上或者2018年底银幕数量大于200以上 319 | 你可以帮我算一下那些在今年第四个礼拜的票房就高于5000000,还有票房的占比也达到0.05以上的电影数量吗? 320 | 2019年中国混凝土销量超过10万吨并且产能超过20万吨的有哪些公司? 321 | 请从表上查一下,2019年中国混凝土销量达到10万吨以上且产能达到20万吨以上的有哪些公司? 322 | 你好,帮我找找2019年中国混凝土销量大于10万吨且产能大于20万吨的有哪些公司? 323 | 月涨跌幅小于0的股票,其2011年的市盈率以及最新的一个评级分别是什么 324 | 根据股票月涨跌幅小于0可以查询2011年他的市盈率吗,最新的评级应该也能查吧 325 | 这一年的涨跌幅大于10%或者本月涨跌幅大于0的电动汽车公司有哪些? 326 | 请问有哪些电动汽车公司的年涨跌幅大于10%或者这个月的涨跌幅是大于0的? 327 | 我想知道有哪些电动汽车公司年涨跌幅大于10%或者本月涨跌幅大于0的? 328 | 平均市净率小于2而且最新股价小于10的股票2011年的收益比率是多少 329 | 总的市值小于50亿而且2013年每股收益小于1元的股票的评级是什么 330 | 请问一下啊2013年的EPS少于1元以及总市值低于50亿的股票的评级的情况怎么样呢 331 | 所有股票的市值不到50亿而且2013年每股盈余低于1元的股票有怎样的评级 332 | 哪些城市上个周二手房销售面积低于10万平,或者比起上上周并没有增长的 333 | 我想问问啊就是上周二手房销售的面积在10万平以下都是哪些城市,或者是环比小于0的 334 | 那个你知道有哪些城市上周销售低于10万平,或者是环比低于0的呀 335 | 地区民航增速大于0或者国内民航增速大于20%时,铁路吞吐量增速最小值为多少 336 | 铁路吞吐量增速最小可以达到多少,此时刚好地区民航增速大于0或者国内民航增速大于20% 337 | 2011年本益比低于20%而且每股收益小于30块的股票,年初以来最小涨幅是多少 338 | 请问哪个电视频道在19年1.14-20期间是排在第一名 339 | 请问19年预计本益比高于1倍的公司共有几家? 340 | 预估一下有多少只股票2019年的市盈率超过1倍 341 | 请问有多少个公司市价盈利比率预计在19年是多于1倍的? 342 | 2018年每股收益大于1块或者股票收益比率大于15%的股票平均市净率为多少 343 | 请问一下啊就是那个2018年每股的收益超过1块或者股票的收益比率高于15%的股票的市净率平均是多少呢 344 | 你好,请问2018年每股盈余高于1块或者股票收益比率大于15%的股票所对应的平均的市净率是多少 345 | 2018年11月行业前5家企业当中生产线超过10条产能占比又大于20万吨的公司的总产能分别是多少 346 | 本周成交超过20而且成交环比大于0的城市有几个 347 | 有几个城市本周成交量是大于20的并且成交环比还是大于0的 348 | 本周有没有成交量大于20以及成交环比大于0的城市,有几个 349 | 东北省有哪些地方在2011年保障房的数量是超过10并且在12年也是大于20的? 350 | 请问有哪些省市的保障房在2011年多于10,而且12年也是大于20的,主要东北省这一个范围。 351 | 超过30万字,而且页数还超300的是什么书 352 | 你知道哪些书字数超30万,页数也超300的吗 353 | 我想问问你啊就是哪些书超过300页,超过30万字的吗 354 | 请问学时多于5且时长小于150的课程编码是什么? 355 | 所有学时多于5的课程中,时长小于150的课程编码是多少? 356 | 所有时长小于150的课程中,学时大于5的课程编码是多少? 357 | 收盘Close大于3200而且成分股数目是2的涨跌幅是多少 358 | 你知道收盘Close大于3200而且成分股数目是2的涨跌幅吗,能不能帮我查一下啊 359 | 涨跌幅多少时它的收盘Close大于3200而且成分股数目是2 360 | 项目实施周期为5年且中央财政经费需要2500万的项目是什么? 361 | 所有项目实施周期为5年的项目中,哪些需要中央财政经费拨款2500万? 362 | 哪些项目的实施周期要5年,还需要2500万的中央财政经费? 363 | 总学分大于2分或者总学时大于32的课程有几个 364 | 有几个课程的总学分大于2分或者总学时大于32的 365 | 你知道总学分大于2分或者总学时大于32的课程名称有多少个吗 366 | 水份超过14%或者杂质低于1%的产品是哪些年生产的 367 | 哪几年的产品所含杂质不足1%或者水份含量超过了14% 368 | 哪些年度有生产杂质含量低于1%或者水份含量超过14%的产品 369 | -------------------------------------------------------------------------------- /data/prepare_data/new_q_exactly_more_strict_match: -------------------------------------------------------------------------------- 1 | 销售面积环比大于5并且销售面积较周均变化大于50的重点城市总共有多少? 2 | 本周收盘价大于20美元或者本周成交大于2000万股的股票有几支 3 | 我想知道周收盘价高于20美元或者本周成交超过2000万股的股票有多少支 4 | 可售数量大于1000同时可售环比超过1的都在哪些地方? 5 | 股价大于10块或者净负债率大于100的股票2011年每股收益是多少 6 | 像股价大于10块或者净负债率大于100这样的股票,2011年的每股收益分别是多少 7 | 哪一年福州的土地成交数超过10的,而且住宅建筑的成交面积也超过100万平 8 | 平均市净率大于2%或者重估净资产大于20的股票溢价率为多少 9 | 重估净资产超过20的股票溢价率是多少或者平均市净率大于2的溢价率是多少 10 | 今年第1周周票房大于1000万并且票房占比大于10%的影片有哪些? 11 | 请问一下今年第一周票房占比超10%,周票房还超过1000万都是什么影片呀? 12 | 股价大于5并且总市值大于50的公司有哪些? 13 | 有哪些公司超过5元每股并且总市值大于50的? 14 | 麻烦请问下有哪些公司每股5元以上的,还有总市值也超过50的? 15 | 2017年净资产收益率大于10%或者2017年股息率大于1%的股票评级是什么 16 | 那些2017年净资产收益率大于10%或者2017年股息率大于1%的股票都是怎么评级的 17 | 周涨跌幅大于20%或者周换手率大于2%的港股总市值为多少 18 | 你知道周涨跌幅大于20%或者周换手率大于2%的港股总市值吗 19 | 总市值高于100亿或者周成交额高于10亿的传媒互联网行业A股周涨跌幅是多少 20 | 传媒互联网行业总的市值大于100亿或他的周成交金额大于10亿的对应的一周的涨跌幅是多少呢 21 | 你知道一周的成交额在10亿以上或者是市值在100亿以上的传媒互联网的行业A股的周涨幅吗 22 | 股票总市值低于100亿或者股价低于10块的,那该怎么评级嘞 23 | 我想知道股票的价格低于10元或者总的市值不超过100亿的股票的一个评级情况 24 | B收盘价大于10并且B涨跌幅大于1的传媒股总共有多少? 25 | 请问一下B收盘价大于10并且B涨跌幅大于1的传媒股总共有多少? 26 | 诶,总市值超过100亿,还有股价也大于10的共有几家公司啊 27 | 全球物流同比增长率大于20%或者销售收入大于2000以上的公司有哪些? 28 | 就是那个市值超过100亿,或者股价在10元以上的都是什么证券啊 29 | 容积率大于2或者每套平均面积大于200平的楼盘,成交均价是多少 30 | 咨询一下套均面积超过200平或者容积率大于2的楼盘成交均价 31 | 能不能根据容积率大于2或者每套平均面积大于200平来查询楼盘的套均面积 32 | 你好啊,就是市值在100亿以下的,或者是股价低于10的都是哪些地产公司啊 33 | 请问在总市值低于100亿,或低于10元每股的都是什么公司啊 34 | 楼面价格超过500并且成交超过5宗的城市有吗 35 | 请问下有没有那种楼面价格在500以上成交数还超过5的城市 36 | 哪些城市在上周的住宅用地成交中,楼面价格高于500以及成交超过5宗的 37 | 那个福州降价幅度超过10%或者楼盘售价超过10000每平的都备注了啥 38 | 住房3个月移动日均成交量高于30000平方米,那可以销售的面积和两个周期内的变化比情况怎样 39 | 我就想知道环比和销售面积啊,它3个月移动日均成交量高于30000平方米的 40 | 我能问问收盘价高于5的,或者增发价格大于50的都是哪些证券,为啥增发啊 41 | 你知道增发价格大于50,或者收盘价大于5的都是什么证券啊,为啥定向增发啊 42 | 那些一线城市小于4000万平或者二线城市小于40000万平的房地产销售面积预测都是什么时候预测的 43 | 市值大于100亿或者股价大于10块的股票,最新每股净资产最小值是多少 44 | 像市值大于100亿或者每股价格价高于10块这样的股票,他们的最小最新每股净资产是多少 45 | 成交量大于20万而且成交额小于20000亿的股票有哪些 46 | 成交量大于20万的股票当中成交额小于20000亿的有哪些 47 | 什么股票成交量大于20万而且成交额小于20000亿 48 | 本月涨跌幅大于-2并且年涨跌幅大于-20的交运总共有多少个? 49 | 11年每股盈余大于1的,或者是月涨跌幅大于10的证券代码是什么呀 50 | 共有几家公司市值高于300亿,或者总股本超过30亿股的呀 51 | 你帮我算算总市值大于300亿的,或者总股本大于30亿股的有几家公司啊 52 | 诶你知道有多少家公司总股本超过30亿股,或者是市值超过300亿的呀 53 | 54 | ((Apr)不等于3)时间是多少 55 | 我想知道那些11年股价收益比率大于10倍,每股税后利润也超1块钱的公司数量是多少 56 | 你知道上周楼市成交在100套以上同时同比增长还超过10的城市都有哪些吗? 57 | 我想咨询一下就是上周楼市成交多于100套以上而且它的成交量同比增长还在10%以上都是集中在中部哪些城市? 58 | 3月套数大于100并且3月均价大于10000的楼盘一共有多少? 59 | 平均市净率大于2%或者重估净资产大于20亿的股票总市值最大值达到多少 60 | 在所有重估净资产大于20亿或者市净率大于2%的股票中,总市值的最高值是多少 61 | PB超过2%或者重估净资产超过20亿的那些股票中最高市值是多少啊 62 | 最新收盘价大于5块或者增发价格大于50块,想知道股票倒挂率是多少 63 | 对于那些最新收市价超过5块或者增发的价格大于50块的股票,你知道它的倒挂率是多少吗 64 | 周成交额大于5亿或者周成交大于5000万股的股票平均周收盘价为多少 65 | 你知道周成交额大于5亿或者周成交大于5000万股的股票周收盘价均值吗 66 | 想了解在上周房子成交量在1000套以上同时成交量环比增长大于1的都有哪些城市? 67 | 麻烦请告知上周房子成交量多于1000套而且成交量环比超过1的城市谢谢 68 | 股价小于10块或者总市值高于100亿的股票是哪个公司的 69 | 哪个公司的股票市值低于100亿或者股价不足10块钱 70 | 哪些证券的市值低于1000亿,或者股价低于10元的呀 71 | 你知道什么公司的股票价格是在10块以下的吗,那股票总价值少于1000个亿的呢,又有哪些公司 72 | 你帮我查一下那些每股交易价格低于10块钱的,或是总市值在1000亿元以下的公司名吧 73 | 2011同期大于100并且2012至今大于10的三线城市总共有多少? 74 | 你知道2012年5月28号收益高于10块的投资组合市值多少吗或者股份低于100手的市值多少 75 | 投资组合市值多少时它的股份低于100手或者2012年5月28号收益高于10块 76 | 股价小于30块或者市值低于300亿的公司有哪些 77 | 哪些公司的市值小于300亿或者股价不足30块 78 | 有没有低于30元每股或者市值在300亿以下的公司,劳您帮我看看 79 | 诶,你知道有几家公司12年的市盈率大于10,EPS也大于1的吗 80 | 有哪些证券最新市值达到100亿港币并且本周涨幅大于10的? 81 | 请问有哪些证券最新市值达到100亿港币并且本周涨幅大于10的? 82 | 我想知道最新市值达到100亿港币并且本周涨幅大于10的证券有哪些? 83 | 呃就是股价在10以上,又或者是总市值在100以上都有哪些公司啊 84 | 哪几家公司的市值是在100以上,或是其股价超过10的 85 | 我想知道就是市值在100以上的都有哪些公司,又或者是股价大于10的 86 | 哪些公司的股票价格高于10元,或者是市净率估值高于1倍的呀 87 | 你好,你知道股票平均市净率估计大于1倍的是什么公司吗,还有最新的股价超过10块的公司呢,又叫啥名啊 88 | 你帮我查一下那些股价超10块钱一股的,或是市净率预计超1倍的公司名吧 89 | 2011年股票收益比率大于10%或者每股收益大于1块的公司有几个 90 | 你知道像2011年股票收益比率大于10%或者每股收益大于1块这样的公司简称有多少个吗 91 | 股价在10以上而且总市值高于100的开发类地产公司都有哪些? 92 | 你知道股价高于10同时总市值超过100的开发型地产公司吗?麻烦告知一下谢谢。 93 | 那个总市值超过100亿的,或者总股本超过10亿股的都是哪些证券啊 94 | 查查看哪些股票会有超过100亿的市值,或者是超过10亿股的股本啊 95 | 你知道市值100亿以上的都是哪些股票吗,还有总股本超过10亿股的呢 96 | 诶,哪个城市成交同比增长在100以上,或者是环比增长大于1的呀 97 | 我想问一下啊就是哪些城市其环比增长超过1,或同比增长超过100的 98 | 那个股价大于10,或者是每股盈余大于1的都是什么公司来着 99 | 市净率大于2并且静态市盈率大于20证券代码是多少 100 | 市净率大于2的证券代码哪个静态市盈率大于20 101 | 有没有市净率大于2并且静态市盈率大于20的证券代码 102 | 请问哪个楼盘在5月份的时候平均价格大于40000.1平还有他的月环比的涨幅大于4 103 | 诶,就是啊成交面积达100万平米以上,或者是每一宗成交的土地面积都有10万平米以上都是哪几年的呀 104 | 福州哪些年的总的成交面积超过100万平的,或是每宗成交面积在10万平以上的 105 | 请问就是福州啊有哪些年的住宅建筑面积成交了有100万平以上的,或者其每宗成交的面积都超过了10万平的 106 | 持股数量大于150万并且最新股价大于15元的最新市价平均是多少? 107 | 请问持股数量大于150万并且最新股价大于15元的最新市价平均是多少? 108 | 2016年股息率大于4%或者分红比例大于40%的是什么高速 109 | 16年分红比超40个百分点或者同年股息率高于4%的是哪些高速 110 | 请问香港有哪些地产公司股价是超过10元并且在2011每股收益超过1元? 111 | 想了解股票的价值高于10块钱同时11年每股盈余在1块钱以上都是哪些公司? 112 | 哪几个城市住房七天成交超过1的,或者是那个七天成交环比超过10的 113 | 总市值大于100亿而且EPS2013大于1的公司有哪些 114 | 请问有没有哪个公司它在2013年的时候股票每股收益超过1并且总的市值大于100亿的 115 | 想要知道在13年每股收益高于1而且所有股票的市值大于100亿的公司 116 | 2011年股票本益比不足10个百分比以及每股收益大于1块是哪家公司的 117 | 近7日日均交超过200并且近7日日均成交环比超过20的城市总共几个啊? 118 | 总共有几个近7日日均交达到200以上并且近7日日均成交环比达到20以上的城市? 119 | 请问达美的辅助收入营收在10亿美元以上,并且总乘客数量人均超过100,那大概占总收入比重有多少呢? 120 | 达美辅助营收已超过10亿美元,同时它的总乘客数量人均高达100,那占总收入比重的多少呢? 121 | 三类车大于100000辆并且四类车大于10000辆的客车占比最大有多少? 122 | 请问每日车流量在三类车中超过了100000辆而且四类车也超过10000辆,那客车占的比例最大有多少? 123 | 在一天车流量里三类车多于100000辆同时四类车在10000辆以上,想问问客车最多时的比例占了多少 124 | 诶,你知道股票增发价格超过50的,最新的收盘价格也大于5的都是哪些证券啊 125 | 日成交高于2而且日成交环比高于20的城市是哪个 126 | 2012年折/溢价大于-20或者2012年第一季度平均市净率小于2的股票评价是什么 127 | 2012年折/溢价大于-20或者2012年第一季度平均市净率小于2的股票是怎么评价的 128 | 如何对2012年折/溢价大于-20或者2012年第一季度平均市净率小于2的股票进行评价 129 | 净利润下限超过1亿元而且净利润增速下限超过100%的证券有多少个? 130 | 有多少证券净利润下限高于1亿元且净利润增速下限高于100%的? 131 | 请问一下净利润下限大于1亿元和净利润增速下限大于100%的证券共有多少? 132 | 18年每股收益大于1块或者18年股票收益比率大于10%的股票最大股价可达到多少 133 | 你知道18E每股收益大于1块或者18E股票收益比率大于10%的股票股价的最大值吗 134 | 年涨跌幅小于10%,而且月涨跌幅大于1%股票代码是什么 135 | 哪个股票代码年涨跌幅低于10%,还有月涨跌幅高于1%的呀 136 | 你知道那个月涨跌幅超过1%,但年涨跌幅低于10%的这些股的代码吗 137 | 销售套数5月27日至6月2日大于1000套并且销售面积5月27日至6月2日大于10的重点城市总共有多少个? 138 | 最新市值大于50亿元并且最新股价大于5的本周跌幅后10平均是多少? 139 | 请问一下最新市值大于50亿元并且最新股价大于5的本周跌幅后10平均是多少? 140 | 麻烦帮我看看最新市值大于50亿元并且最新股价大于5的本周跌幅后10平均是多少? 141 | 哪些股票的总市值超过了200亿或者总股本大于20亿股 142 | 总股本超过20亿股或者总市值超过了200亿的股票有哪些 143 | 能不能告诉我市值高于200亿或者总股本超过20亿股的股票名 144 | 2011年哪些股票的收益比率超过10%或者每股收益大于1块,其代码是多少 145 | 2011市盈率大于20并且平均市净率估值大于2的公司有哪些呀? 146 | 那个哪些公司股价大于10块,或者是市值小于100亿的呀 147 | 每股价格10块以上,或者市值低于100亿的都有哪些公司啊 148 | 影院数量大于50并且2018年底银幕数量大于500的2018年票房平均是多少钱? 149 | 请问一下影院数量大于50并且2018年底银幕数量大于500的2018年票房平均是多少钱? 150 | 麻烦咨询一下影院数量大于50并且2018年底银幕数量大于500的2018年票房平均是多少钱? 151 | 上周成交量大于1000套或者成交量同比增长超过10%的在什么城市? 152 | 能否告诉我上周的成交量是大于1000的或者是成交量同比超过10%增长的城市名 153 | 哪些公司的股价大于20元或者市值超过200亿 154 | 你知道什么公司的市值高于200亿,或者是股票价格超20元的吗 155 | 2018年票房大于50亿元并且目前影院数量大于500的院线有哪些? 156 | 有哪些院线2018年票房大于50亿元并且目前影院数量大于500的? 157 | 麻烦请问下2018年票房大于50亿元并且目前影院数量大于500的院线有哪些? 158 | 哪些区域的二手房上周销售大于10万平或者年初至今累计销售面积大于100万平 159 | 二手房上个周销售大于10万平或者从年初到现在累计销售面积大于100万平的区域有哪些 160 | 你能告诉我二手房上星期销售超过10万平或者从年初到现在累计销售面积高于100万平的区域吗 161 | 建筑面积大于20000万平方米而且同比20以上的成交楼面平均价格是多少 162 | 20000万平方米以上的建筑面积当中同比20以上的成交楼面平均价格是多少 163 | 建筑面积大于20000万平方米而且同比大于20的成交楼面平均要多少钱一平方 164 | 有哪些公司股价超过10元并且市值达到100亿以上的吗? 165 | 麻烦请告诉我股价高于10元,而且市值超过100亿的公司名,谢谢。 166 | 你知道什么公司的股票是超过10块一股,还有它的市值也高于100亿的吗? 167 | 哪些快递公司收入少于200亿的,或者是净利润小于20亿的 168 | 诶,给我查查看收入低于200亿的,或净利润低于20亿的都有哪些快递公司 169 | 本周价格大于10000并且价格环比大于1的城市总共有多少? 170 | 总共有多少城市本周价格大于10000并且价格环比大于1的? 171 | 请问帮我查一下本周价格大于10000并且价格环比大于1的城市总共有多少? 172 | 18E每股收益大于1块或者18E本益比大于10%的股票股价多少 173 | 你知道18E每股收益大于1块或者18E本益比大于10%的股票股价吗 174 | 什么股票成交量超过20000万手并且涨跌幅还大于2 175 | 交易超过20000万手并且涨跌幅还大于2的股票是什么 176 | 有什么股票涨跌幅大于2成交量还超过20000万手 177 | 哪些影投公司的周票房大于1000万而且场均人次大于10 178 | 一周票房超过1000万并且场均人次大于10的影投公司有哪些 179 | 你知道那些一周票房超过1000万并且场均人次大于10的影投公司名称吗 180 | 市值超过100亿或者收盘价大于10块的股票有哪些 181 | 你知道市值超过100亿或者收盘价大于10块的股票名称吗 182 | 股价收益比率高于10或者每一股收益大于1的股票属于哪些公司啊 183 | 啊,就是股价市盈率超过10或者每股盈余大于1的持股公司是哪些啊 184 | 诶,那个5月20号到26号二手房成交面积超过10万平的,或者成交超过1000套的都是什么城市啊 185 | 请问地产股中最新市值达到100亿以上同时最新的股价也超过10的证券都有哪些? 186 | 你知道地产股里最新市值多于100亿,而且最新股价也达到10以上的证券吗? 187 | 2017年股息率大于1或者企业价值倍数大于10的股票17-20E的最小增长率为多少 188 | 规划建筑面积大于100000万㎡并且成交楼面均价大于1000元/㎡的平均溢价率最小是多少? 189 | 请问规划建筑面积大于100000万㎡并且成交楼面均价大于1000元/㎡的平均溢价率最小是多少? 190 | 你好,麻烦你看看规划建筑面积大于100000万㎡并且成交楼面均价大于1000元/㎡的平均溢价率最小是多少? 191 | 有几只股的10年的收益比率是超过20%的或者每股收益高于1块 192 | 2016年,什么机器人的销量高于2000或者市占率超过了2 193 | 你好,你知道那些11年本益比高于10倍,每股盈余也高于1块钱的公司它们的股价吗 194 | 持股数量超过500万股而且最新股价超过5块一股的模拟组合是哪个 195 | 哪个城市环比超过40并且在这一星期的成交面积高于4万平的 196 | 想要了解在2012年6月19日环比超过40而且在这周成交面积超过4万平的城市 197 | 你帮我看看有哪些影投公司有超过100家影院,或者是18年票房大于10亿的呀 198 | 你好啊,18年票房高于10亿的有哪些影投公司啊,还有有那个超过100家影院的呢又是哪些影投公司啊 199 | 股票总价值低于100亿或市销率不到10%的股票简称是啥 200 | 小于100亿元总市值或者PS小于10%的股票是什么 201 | 股票市销率低于10%,或市值不到100亿的股票有哪些 202 | 我想知道绝对量超过100,同比增长还不足10%的指标都有哪些? 203 | 我想问你啊就是那些预计20年市盈率会低于10,每股盈余也会少于1的都是哪些公司啊,这些公司股价你知道吗 204 | 本周销售面积大于10并且本周销售套数大于1000的城市有哪些? 205 | 18冬春航班数量大于10000并且航班占比大于10的净利润最小是多少? 206 | 哪些城市前周成交量超过了200万平或者年初至今成交量超过2000万平 207 | 年初到现在成交有超过2000万平的或者上上周成交超过了200万平的城市有哪些 208 | 有没有年初到现在成交了有2000万平以上的或者上上周成交量超过了200万平的城市 209 | 日成交环比大于10并且7日成交环比小于1的7日成交平均同比是多少? 210 | 请问一下日成交环比大于10并且7日成交环比小于1的7日成交平均同比是多少? 211 | 你知道有哪些楼盘它的均价在1000以上并且楼盘容积率超过1的吗? 212 | 请问楼盘均价超过1000同时楼盘容积率可以大于1的楼盘有哪些? 213 | 北京的楼盘有哪些是楼盘均价高于1000,而且楼盘容积率还大于1的? 214 | 那个股价超过了10的,并且啊11年的每股盈余都超过1的是什么公司啊 215 | 我想知道就是哪些公司是10元以上每股的呀,而且啊2011每股收益也大于1的 216 | 查查看,看都是哪些公司股价超过10,而且11年每股盈余也大于1的 217 | 12年的市盈率高于10倍,预计12年的每股盈余也高于1元的公司有哪些 218 | 你好,你知道什么公司2012年的本益比超过10倍,而且每股收益估值也超过1块的吗 219 | 你可以帮我查一下12年的市价盈利比率超10倍,并且估计每股税后利润也超1块钱的公司名吗 220 | 最新收盘价小于10块而且倒挂率小于100%的股票增发目的是什么 221 | 你知道最新收盘价小于10块而且倒挂率小于100%的股票增发目的吗 222 | 注射剂生产品规低于10数量个或者标明使用中性硼硅的品规数量低于1个的样本医药销售金额是多少 223 | 注射剂样本医药销售金额为多少,假如品规低于10数量个或者标明使用中性硼硅的品规数量低于1个 224 | 是这样,如果说注射剂生产中标明使用中性硼硅的品规数量要低于1个或者品规低于10数量个,这样的样本医药销售金额多少合适 225 | 乘用车产量/进口量超过600000辆或者企业数量超过60的是哪种分类 226 | 哪种分类的企业数量高于60或者乘用车产量/进口量高于600000辆 227 | 乘用车产量/进口量达到600000辆以上或者企业数量达到60以上的是国产还是进口 228 | 那个13年每股盈余达到了1以上的,或者是总的市值在100亿以上的都是什么公司啊 229 | 能给我就是列一下那个总市值超过100亿的,或是13年每股收益大于1的公司吗 230 | 查查看,看有哪些公司有超过100亿市值的,或者是13年EPS超过1的 231 | 哪些快递公司的收入超过100亿或者净利润低于10亿 232 | 收入高于100亿或者净利润小于10亿的公司有哪些 233 | 你知道收入有100亿以上或者净利润10亿以下的公司都有哪些吗 234 | 最新收盘价大于5块或者倒挂率大于50%的股票有哪些 235 | 那个股价大于10的,或11年每股盈余在1以上的都是哪些公司啊,它们的证券代码又是什么啊 236 | 什么公司每股价格都超10元的呀,或者是11年每股收益超1的,那你知道这些公司的证券代码吗 237 | 能给我说说那些超10元一股,或是11年的EPS在1以上的公司名,还有这些公司的代码也能告诉我吗 238 | 3月份的均价超过20000套数超过200的楼盘是哪个 239 | 请问有没有哪个楼盘在3月份的价格平均超过20000而且套数在200以上 240 | 想要了解2012年3月份北京的一些楼盘的价格,均价大于20000而且套数超过200的楼盘是哪几家 241 | 股价大于10并且总市值大于100或者年初以来市值大于30的公司有哪些啊? 242 | 2016销量占比大于5%并且2016销量大于5000的机器人厂商有哪些? 243 | 想了解成交的建筑面积大于100万平米同时跟去年同期比累计超过10%的城市都有哪些? 244 | 你知道12年5月份有哪些城市的土地成交建面达到100万平米以上而且累计成交跟去年同期比较高出10%的 245 | 总股本超过10亿股且总市值超过100亿元的市净率最大是多少? 246 | 请问一下总股本高于10亿股并且总市值高于100亿元的市净率最大是多少啊? 247 | 麻烦帮我算算总股本达到10亿股以上并且总市值达到100亿元以上的市净率最大是多少? 248 | PE-TTM大于10并且PB大于1的股票总共有多少? 249 | 销售套数年度周动均态大于1000或者销售套数较周均变化大于10的重点城市都有哪些啊? 250 | 资产负债率大于10%并且股息率大于1%的省份有哪些? 251 | 请问收盘价超过10元并且本月收益率低于1%的证券都有哪些? 252 | 麻烦请跟我说一下收盘的价格在10元以上而且这一月收益率小于1%的证券谢谢 253 | 市值超过300亿元并且当前股价大于30元的证券有哪些? 254 | 有哪些公司股票总价值大于300亿并且目前的股票交易价格大于30块钱的? 255 | 请问一下,市值超过300亿元并且现阶段股票价值高于30块的是什么证券 256 | 你知道厦门有哪些地方它的楼盘售价在1000元每平以上并且降价幅度不高于10的吗? 257 | 麻烦请告知厦门楼盘出售价超过1000元每平以上同时降价幅度还小于10的地方,谢谢。 258 | 我想咨询一下就是楼盘售价大于1000元每平而且它的降价幅度不超过10的都集中在厦门哪些地方? 259 | 预计利息支出小于1000万或者单位通行费利息支出余额小于100万的最大占比是多少 260 | 你能告诉我预计利息支出小于1000万或者单位通行费利息支出余额小于100万的最大占比吗 261 | 占比最大值多少时预计利息支出小于1000万或者单位通行费利息支出余额小于100万 262 | 国内客运量占比大于10%并且总市值大于100亿的航空公司有哪些? 263 | 请问有哪些快递公司净利润达到1亿以上同时利润同比赠速超过100? 264 | 你知道净利润超过1亿元并且利润同比增速达到100以上的快递公司都有哪些? 265 | 麻烦跟我说一下净利润高于1亿元并且利润同比赠速超过100的都有哪些快递公司 266 | 你好,请告诉我绝对量在100以上,而且同比增长也在10%以上的指标谢谢。 267 | 哪些股票的总股本大于10亿股而且总市值超过100亿 268 | 总的市值超过100亿或者资本总额高于10亿股的股票有哪些 269 | 你好,请问所有股票的市值超过100亿或者资本的总额大于10亿股的是什么证券 270 | 哪个城市2011年周平均成交量大于1000套,而且占2011年均值比重超过100的 271 | 你好,我想查询下11年每周平均成交超1000套,并且占11年均值的比重还超过100的城市名 272 | 请问有哪些证券的股价超过10块一股同时总市值达到100亿以上的? 273 | 有哪些公司总市值大于200亿,并且PB大于2的呀 274 | 所有股票的市值大于200亿的,同时市净率还大于2的都是什么公司啊 275 | 你给我算算那个市值大于300亿的,总股本还超过30亿股的有几个地产证券啊 276 | 我想知道就是总股本有超30亿股的,市值还在300以上的有几个地产公司啊 277 | 请问有哪些公司它的销售收入超过100百万美元并且同比增长率达到10以上的? 278 | 你知道销售收入在100百万美元以上同时它的增长率超过10的公司都有哪些吗? 279 | 请问一下2019年1月14日至18日期间市盈率超过40而且股票价格超过4块钱一股的代码是什么 280 | 想要了解2019年1月14日到18日市盈率大于40股价高于4块钱的股票代码 281 | 哪些证券市值超过80亿的呀,而且股价还大于8的呀,证券代码多少啊 282 | 呃,我想知道那个高于8元每股的,市值还高于80亿的都是哪些证券啊,代码是啥啊 283 | 在19年第4周的周票房超过500万,并且票房占比大于5%的电影一共有多少部? 284 | 月成交量超1000而且同比增长超100的是哪个城市 285 | 哪个城市月成交量超1000同比增长超100 286 | 第52周票房高于100万同时观影人次超过1万的都有哪几家电影院? 287 | 请问绝对量在100以上,而且同比增长大于1%的房地产指标都有哪些? 288 | 平均市净率超100并且市销率超10股票,他的代码是什么 289 | PS高于10,平均的市净率又高于100的股票代码有哪些 290 | 上周成交超1000套,而且成交量同比增长大于10的城市有几个呀? 291 | 你帮我查一下目前成交的量同比增长高于10,上周还成交了1000套以上的城市数量吧 292 | 月涨幅超过10%,静态市盈率也在100以上,那市净率是多少呢? 293 | 我想知道月涨幅超过了10%,静态PE也高于100的公司其PB大概是多少? 294 | 一线城市销售大于4000万平米或二线城市销售大于40000万平米的累计值同比增速最小是多少? 295 | 请问一线城市销售大于4000万平米或二线城市销售大于40000万平米的累计值同比增速最小是多少? 296 | 有多少个楼盘的楼盘均价小于10000或楼盘容积率大于1的呢 297 | 楼盘均价低于10000或者楼盘容积率超过1的楼盘有多少个呀 298 | 你可以帮我查一下楼盘均价不足10000或者楼盘容积率大于1的楼盘有几个吗 299 | 请问收盘价格高于10元而且总的市值超过100亿的证券都有哪些? 300 | 有什么证券它的收市价是在10元以上同时所有股票的市值还大于100亿的? 301 | 总市值不足400亿或者平均市净率小于4%的公司有哪些 302 | 哪些公司的它平均的市净率是低于4%的或者总的市值不超过400亿 303 | 满足所有股票的市值小于400亿或者股票市净率小于4的公司有吗,麻烦帮我查一下,谢谢 304 | 12年5月同比大于10并且12年4月同比大于1的12年5月环比平均是多少? 305 | 请问一下12年5月同比大于10并且12年4月同比大于1的12年5月环比平均是多少? 306 | 麻烦问问12年5月同比大于10并且12年4月同比大于1的12年5月环比平均是多少? 307 | 你可以找到日成交在200以上环比超过20的城市吗 308 | 想知道哪个城市环比超过20而且日成交超过200 309 | 最新的股价在10块以上市值还大于100亿的证券的代码是什么啊 310 | 17-20E股票增长率大于10%或者18E市盈率相对盈利增长比率大于2的股票,最大市值达到了多少 311 | 就是那个,17-20E股票增长率大于10%或者18E市盈率相对盈利增长比率大于2的股票,关于市值,最大可以大到多少 312 | 总市值大于100亿而且总股本大于10亿股,想问一下股票涨幅是多少 313 | 你知道所有股票的市值超过100亿并且资本总额大于10亿股的股票涨幅吗 314 | 2010成交面积大于10并且2011年成交面积大于100的城市有哪些? 315 | 有哪些城市2010成交面积大于10并且2011年成交面积大于100的? 316 | 在2012年5月份中深圳有哪些楼盘均价大于10000元/㎡并且它的月环比涨幅还超过了10%? 317 | 哪些公司市值超过100,或股价大于10的 318 | 那个总市值在100以上,或者是股价超过10的都有哪几家公司啊 319 | 2018年底银幕数量大于500并且单银幕票房大于50万元的院线总共有多少家? 320 | 你知道钢企里净资产收益率大于10同时它季度每股收益也超过1的证券都是哪些吗? 321 | 超过300页而且卖价高于30元的书一共有几本 322 | 哪些书超过了400页或者卖价是大于40块的 323 | 售价高于40块或者页数超400页的是什么书 324 | 公示金额超过10000元而且人数超过100人的公司有哪些呢,都在哪个区? 325 | 你好,帮我找找有哪些公司的公示人数超过100个人并且公示的金额超过10000元的,都在哪些区呢? 326 | 展会位费用高于30000或者展位面积超过30平方米的展会一共有几个啊 327 | 我想知道展位面积大于30平方米或者展位价格高于30000的参展名称有多少个 328 | 项目实施5年的而且中央财政给的经费超过5000万元的项目有哪些呢 329 | 场租合同金额超过10万且展览规模超过10000平米的企业有哪些?展会有哪些? 330 | 有哪些项目做的周期是5年而且给的经费低于5000万 331 | 请问一下中央财政给的经费不超过5000万且项目做的周期是5年的有哪些呢 332 | 收盘价高于1000或者成交超过1000000股的指数有哪些 333 | 哪些指数的成交量是高于1000000股的或者收盘价是大于1000的 334 | 我想知道收盘价超过1000或者成交超过1000000股的指数名称 335 | 请问5月大于1000万元并且同比增长大于10%的指标有哪些? 336 | 有哪些指标在5月份大于1000万元并且同比增长大于10%的? 337 | 你知道5月大于1000万元并且同比增长大于10%的指标有哪些吗? 338 | 这个预计征收户数超过100户的并且预计征收的面积超1万平方米的项目有哪些呀? 339 | 你知道这个预计征收户数达到100户以上的而且面积征收达到1万平方米以上的项目有哪些呢? 340 | 目前来说,预计征收的户数有100户以上的而且面积征收有1万平方米以上的有哪些项目呢? 341 | 项目实施周期为5年并且中央财政经费大于5000万元的项目牵头承担单位有哪些? 342 | 麻烦问一下项目实施周期为5年并且中央财政经费大于5000万元的项目牵头承担单位有哪些? 343 | -------------------------------------------------------------------------------- /data/prepare_data/new_q_text_contain_similar: -------------------------------------------------------------------------------- 1 | 请问哪个香港市场重点房地产公司的股票现价低于2.4的 2 | 市值为1369.38亿元或周涨跌低于3%的是什么股票? 3 | 你知道那些17年定增,而且增发目的是项目融资的证券代码是啥啊,都是哪些证券啊 4 | 商品房上周成交小于17万平的是哪几个城市 5 | 容积率大于1,套均面积大于100平并且成交均价大于8000块的有几个天津新盘 6 | 我了解到青岛海尔通信卖出去的数量已高于1000,想问一下占全部数量的比重有多少 7 | 我的妈呀,土地出让金大于17000亿,那他的平均溢价率得多少啊,出让时间又是什么时候 8 | 我能问问就是北京哪些楼盘在12年5月份的时候是超过3万每平的呀 9 | 你好啊,就是那个每套面积平均下来都超过100平的,或者是成交均价在10000以上的都是上海哪里的哪些楼盘啊 10 | 请问东部地区销售面积同比增长小于10,那么它的销售额同比增长多少呢? 11 | 储存量超过50万吨或者面积大于1平方公里的矿区有什么矿 12 | 涨幅前5位中市净率低于11的股多么,能不能一一说一下 13 | 那个是什么参数啊,上海的小于10或者是北京低于24的数值表示哪个参数 14 | 你帮我查一下那些12年的每股税后利润达到7毛8以上的公司叫啥名吧 15 | 你帮我查一下周成交少于500万股,周成交额也低于10亿的都是哪些证券啊 16 | 你好,我想了解一下2月份期房套数的的情况,我只知道它的总成交已经在100以上了,那同比呢? 17 | 宝钢股份季度每股收益不足10的话,那市盈率呢,与2018.10.31的收盘价对应,会是多少? 18 | 你好,你帮我查一下要招的人数超过10,学历还要求得是本科或者是本科以上的是什么岗来着 19 | 所有学历最低需要本科的职位中,哪些只招1个人? 20 | 请问232号宿舍存在什么问题? 21 | 请问一下11年同期成交超过00万平,还有12年至今也成交在100万平以上的城市的平均累计同比是多少? 22 | 请问学费500的课程哪些是招考过4级的学生的? 23 | 1月12号省级卫视晚间综艺节目收视率前10中有几个是浙江台播的呀,并收视率还大于0.2%啊 24 | 属于东城区或者医院代码为1110008的医院有几个 25 | 商品房竣工面积低于10亿平的竣工率和开发投资总额分别是多少 26 | 麻烦问一下一共有多少楼盘3月套数大于100并且3月均价大于10000的? 27 | 请问那些在16年为了配套融资而增加发行新股的公司叫啥名啊 28 | 新湖中宝PE2010已高于10,PE2012呢,是多少? 29 | 股价大于18元的股票和公司代码有哪些 30 | 养殖鲍鱼且面积小于1万平方米的养殖场是哪个? 31 | 想要了解一下2010年每股收益在8.8毛钱以下的公司叫啥名 32 | 我想哪些钢企17年钢材产量大于300万吨,或者17年成本低于100亿的呀 33 | 请问哪些招1个人的岗位是需要最低本科学历的? 34 | 生产日期或批号为43191或者抽查合格的产品有哪些 35 | 预算费用为65.5亿或者在2015年到2019扩建的机场有哪些 36 | 我想咨询一下就是11年深圳平均下来每周成交少于10,那12年深圳的周均成交大概会有多少? 37 | 跌幅超过10%并且收盘的价格大于3元钱的地产类股票有那几个? 38 | 总共有多少个股票PE-TTM大于10并且PB大于1的? 39 | 我想知道啊就是12年5月都有哪些楼盘平均每套面积大于100平的呀,或者成交均价超过10000的呀,在上海哪啊 40 | 你好啊,你帮我查一下那个11年12月的时候啊商务印书馆出版了有哪些书啊 41 | 国内钢企,哪些股票的净资产收益率超过4%以及代码有哪些 42 | 那个批文数占比不足11%但是需要需进行一致性评价的是哪些公司啊 43 | 你知道销售环比大于0或者销售同比大于-45的二手房上周的销售总面积吗 44 | 请问一下哪本书是在09年的时候出版的呢 45 | 2010年每股的收益高于6毛或者股票PE超过50%得到股票,总的市值最小是多少 46 | 2016A每股收益低于4块的公司有吗,哪几家啊 47 | 你好,北京住房区域成交中的小于25的数值是哪个餐厨的值,或者上海数值低于10的那部分 48 | 想咨询一下华科光电他们那个展位的面积在10平方以上了,那展位需要的费用是多少啊 49 | 你帮我算算收盘价格超过5元的万科它的总市值是多少来着? 50 | 那个17年1月1号出版的,定价还低于20的一共有几本书啊 51 | 所有招1人的职位中,哪些是需要学时学位的呢? 52 | 了解到哈尔滨的新阳支行在网络上预约分配的额度在10000枚以上,那网点的呢 53 | 你好,你知道这些市值超过100亿元,评级为增加持有的公司它们平均的股价是多少吗 54 | 请问啊你啊那个5月27到6月2有几个城市卖出房在2000套以上的呀,或者是卖出面积达到20万平以上的呀 55 | 可以查一查什么时候福州市的成交住宅土地宗数超过10面积超过100万平吗 56 | 北京在2011年日均成交达到1以上,2012年呢? 57 | 你帮我查一下15级的班级数量吧 58 | 请问一下2018年11月行业前5家企业产能生产线大于10并且在产产能大于100万吨的产能占比平均是多少? 59 | 你好,请问当股票倒挂率多少时它的最新的收盘价大于5块或者增发的价格大于50块 60 | 什么万州区的项目补助资金超过了10万? 61 | 市值超100亿或者股本大于17的股票有么,有的话,请详细告诉我 62 | 宝鸡市眉县首善镇三寨小学综合实验楼这个项目是在2017年动工的,一个投了多少钱啊 63 | 想要了解的是平均售价超过3万的是哪些楼盘,以及其装修的情况 64 | 诶,你有数过17年的时候有几家那个教育行业公司增发目的是配套融资和那个融资收购其他资产的吗 65 | 你好,请跟我收一下沙钢企业季度每股收益是多少谢谢,我只知道它净资产收益率已达到10. 66 | 哪本书是人民出版社在2016年12月份出版的 67 | 有多少台显示器是在2002年1月购买的 68 | 我想知道09年1月出版的都是什么书,作者是谁 69 | 请问期房套数总成交量高于100,那你知道它的同比占多少吗? 70 | 我查询到YAGEO公司在17年第一季毛利率已达到20%以上,想知道他2018年第一季度是多少? 71 | 本期16个重点城市全部土地成交或者小于25万平方米的有哪些城市 72 | 一线城市中北京12年6月它的可售环比已经超过1了,那可售数量是多少呢? 73 | 东方航空PES2018E低于1,我想知道他现价是多少? 74 | 投资金额大于8亿或者持股比例大于20%的公司有哪些 75 | 请问在2017A对锂电池的需求量已超过了20,那对磷酸铁锂和钴酸锂需求量会是多少? 76 | 那个15年定增的天神娱乐增发目的有几个啊 77 | 我想知道就是那个在11年的时候周均成交量超过10000的一线城市在上周成交了有多少套啊,占11年均值多少啊 78 | 哪些在北京的展会的面积比2万小? 79 | 请问有哪些岗位部门的职位数大于2并且学历学位是硕士研究生以上学历与学位的? 80 | 那个不是一线城市11年的周均成交就已经达到10000以上了吗,那上周成交量多少啊,与11年均值相比,比重多少啊 81 | 你能帮我查一查有多少家影投公司的周票房是低于3000万的吗? 82 | 哪个股票代码PB大于100而且PS大于10 83 | 有几个项目的以建设综合商务中心为、农产品精深加工产业园为内容或者计划投资超过6000000000000元的 84 | 在补助资金高于10万的项目中,属于万州区的是哪些? 85 | 哪些股最后一笔交易的成交价多于1.58的啊,那代码是多少 86 | 全球物流自动化系统销售收入大于30亿美元的公司的最大同比增长率为多少 87 | 那个用地达到1万平以上的有几个建设项目你知道吗 88 | 2011年每股收益大于5毛的股票有哪些,顺便说下代码 89 | 你帮我查一下那个市值大于80亿的,股价还高于8的都是什么证券啊,代码咋写啊 90 | 我知道一下集数达到30集以上的,还有在2017年1月25日发证的电视剧有哪些啊,还有制作单位都有哪些呀 91 | 学历最低需要本科且只需要1个人的专业岗位是哪个呢? 92 | 宁夏中卫市中宁县舟塔乡宏成粮油商贸有限公司的食品有哪些 93 | 请问中部有哪些城市上周成交量超过100套并且同比增长达到10以上的? 94 | 想了解密室逃生1-14至1-20电影票房排在第4名,你知道单周的票房是达到了多少万吗 95 | 涨幅多少的股票总的市值高于100亿同时总股本在10亿股以上 96 | 请问铁龙物流2017股息率高于1,那2017分红比例大概是多少? 97 | 我很好奇2012年1-5月全国房地产开发绝对量超过3000的指标 98 | 我了解到新湖中宝2010年股票的市盈率超过了10,那在2012年它的市盈率有多少 99 | 请问一下哦上市的钢企啊,有没有那个2017年的时候吨钢成本少于3500的公司,有的话那么这个公司那一年的产量和成分费是多少呢 100 | 请问有哪一些公司2011市盈率高于20并且平均市净率估值高于2的? 101 | 你能告诉我16年为了补充流动资金而定增的证券代码吗 102 | 你好啊请问一下上海哪些楼盘的价格在2012年的5月份超过了一万五一平 103 | 公司股价低于26块,并且市值低于374亿的评级结果是什么 104 | PE-TTM大于10的曙光PB是多少 105 | 有几部剧的播放量破5千万了? 106 | 麻烦请问一下都有哪些重点城市销售套数年度周动均态大于1000或者销售套数较周均变化大于10的? 107 | 你能帮我查一下10A每股收益低于1块而且本益比低于20%的股票股价吗 108 | 我在网上看到工程质量监督站在招聘质量监督员,想问一下这个职位是有什么专业才可以 109 | 月环比的涨幅大于1并且5月均价大于3万元/㎡的楼盘有哪些? 110 | 股票股价多少时它的18E每股收益大于1块或者18E本益比大于10% 111 | 什么课是15级金融与证券专业的学生上的呀? 112 | 哪些证券在15年增发的价格少于30的呀 113 | 2月份期房套数总成交量超过100,那么它的同比大概有多少呢? 114 | 我想了解一下啊,关于辽宁鞍山和本溪地区变质条带铁矿的品味,低于35%的矿场多吗,具体是哪些 115 | 属于山东省且注册资金是1千万的企业是哪个? 116 | 有多少本书是中国社会科学出版社在2015年12月份出版的 117 | 股票市值最大为多少可满足17-20E股票增长率大于10%或者18E市盈率相对盈利增长比率大于2 118 | 你好,请问你知道累计票房超过1亿的电影的口碑指数和上映天数吗 119 | 汽车电子板块股票有哪些是PE-TTM大于10并且PB也高于1的? 120 | 我想买房,但是不知道在上一周商品房成交面积超过了28万平或者去年同期商品房成交大于20万平的是哪些城市啊 121 | 你好,你知道13年8月份百花洲文艺出版社出版了哪些书呀 122 | 一共有多少家公司是在15年定增,且增发价高于10元的呀 123 | 涨股和跌股的周涨幅没有达到15.25%,它们分别属于哪些股 124 | 你知道一共有多少个在2005年沈阳那批建的平台吗 125 | 你好啊,你说说1月12号省级卫视晚间综艺节目收视率前10中有多少收视率高于0.2%,而且啊在浙江台可以看的呀 126 | 哪个公司的周涨跌幅低于15%,股票代码是多少 127 | 啊呀,买房贵啊,这个出让金需要多少啊,楼盘情况是成交楼面价格平均1平米低于1300或者建筑面积超过160000万平方米 128 | 有哪些城市在上一周房地产成交量超过1000并且环比小于10的? 129 | 最新的调查,最新股价不足14.6而且最新股票总价值超过44亿港币的是什么股票 130 | 你知道工程投资超过20亿元以上并且输电线路超过1200公里的高压建设项目名称吗 131 | 请问电视的收视率大于0.5%同时市场占有率超过2%的都是在什么频道? 132 | 你能告诉我那些股票价格在26元以下,市值还在374亿以下的公司股票是否应该买入 133 | 你知道那个江苏省的渔港监督局要招几位科员吗,还有这个科员的职位代码我已经知道是8了,你不要再说了 134 | 平均市净率低于1或者PS高于0.8左右的股票有哪些 135 | 上周那个华南城控股不是0.5元以上每股吗,那上周他市值多少啊 136 | 有哪些楼盘月的环比涨幅大于1并且5月平均价格大于3万元/㎡的? 137 | 你好,可以跟我说一下吉祥杭口的PEG数值吗,我只知道它的收盘价是已达到10以上的 138 | 我想知道新疆维吾尔有哪些超过2万平方公里的沙漠呀 139 | 请问一共有多少家院线2018年底银幕数量大于500并且单银幕票房大于50万元的? 140 | 在2011年北京人民日报出版社出版的题名有哪些啊?这当中作者有哪些呢? 141 | 哪些股的成交涨跌幅小于2 142 | 东部地区外出农民工总量省内流动达到1000万人以上,那你知道跨省流动人口有多少吗? 143 | 你好,请问一下打算在2015年到2019扩建或者扩建预算费用达到65.5亿的机场是什么机场啊 144 | 哪些面积不到5000的保护区是在北京房山的? 145 | 有多少本书的售价超过了30块并且书本超过300页 146 | 股票周收盘价均值为多少时它的周成交额大于5亿或者周成交大于5000万股 147 | 诶,你给我算算那个5月27到6月2销售套数达到2000以上的,或者销售面积超过20万平的共有多少个城市啊 148 | 哪些岗位的要求是学历为本科及以上且招5人? 149 | 所有面积小于1万平方米的养殖场中,哪些是养殖鲍鱼的? 150 | 我想问一下区建设工程质量监督站是招什么专业的质量监督员呀 151 | 我想知道就是上市钢企中有哪些在17年的时候其钢材产量超过300万吨,又或者钢材生产总成本低于100亿的呀 152 | 请帮我查询一下平均每天的成交量可以超过280的城市 153 | 单价超过1万元的产品有哪些? 154 | 请问只需要1人的专业岗位中,哪些是需要本科及以上学历的? 155 | 那个16年为了配套融资而增发的天丹文化公司代码是什么啊 156 | 请问北京新影联影业在2018年底银幕数量已大于500,那单银幕票房收入会有多少? 157 | 天神娱乐得滚动市盈率超过1,那它最近12个月的每股收益是多少? 158 | 19年1月7日到13日周票房大于1000万而且场均人次大于10的影投公司有几个 159 | 请问一下PE-TTM大于10并且PB大于1的股票总共有多少? 160 | 2012年每股收益大于1块或者本益比大于10%的股票股价最小达到了多少 161 | 你好,小哥哥,你知道2011年每股收益大于0.5而且本益比大于20%的股票的重估净资产吗 162 | 2012年6月19日上周住宅用地成交面积大于40万平而且楼面价大于400块一平的城市是哪个 163 | 2011年每股收益大于0.5元而且本益比大于20%的股票最新股价是多少 164 | 你好啊,我想知道出现次数大于8万,频率还高于0.1的都是什么词来着 165 | 有几个机场的旅客吞吐量是大于9000万的或者飞机起降大于30万架次的 166 | 哪些影片关注度高于7万的呀,主演有哪些人 167 | 我想了解一下什么公司的股票交易价格是高于12.5毛的呀 168 | 北京时代华文书局在2015年1月份出版了什么书 169 | 规格型号是JS-100型或者数量超过10的的设备有哪些 170 | 我想问问啊就是市值超过500亿,或者是总股本在50亿股以上,又或者是PB大于2的都是哪些证券 171 | 哪些城市在5月20日-5月26日期间新房成交销售套数达到100以上同时销售套数环比不足10? 172 | 什么项目计划超过600亿并打算在2018年下半年开工 173 | 2017年吨钢成本低于3500块的公司,他同年的产量和成本费用分别为多少 174 | 教育行业近三年有哪些证券最新收盘价超过5元并且倒挂率达到50%以上? 175 | 请问一下楼盘均价大于21000平的楼盘有吗是哪个呢 176 | 已知书的国际标准书号为9787111601722,或9787111601548,它的内容能不能简单和我说一说 177 | 请问什么机构在天河且床位数超过了50个? 178 | 哪些股票11年EPS大于5毛,它的代码呢 179 | 16年5月出版的明史演义写了什么东西你知道吗 180 | 有没有市值比重小于30%的模拟组合啊,持股数量多不多啊 181 | 春秋航空的PE2018E是低于20的,你知道EP2019E是多少吗? 182 | 有几只上市钢企股17年的产量超过50万吨或者17年生产成本大于100亿 183 | 股票总的市值最小为多少时溢价率大于负30或者上涨的幅度超过11.4% 184 | 2011年1月份社会科学文献出版社出版的丛书是什么啊 185 | 所有北大出版社出版的书中,哪些是贵过50的? 186 | 换手股的收盘价大概情况怎么样,主要是周换手率低于21%的那部分,分别是哪些股啊 187 | 想了解深振业A的11EEPS不足1时,11EPE是多少? 188 | 二手房销售环比大于0或者销售同比大于-45,那么上个星期总的销售面积是多少 189 | 有没有10年的EPS超过1元或者PE大于20%的股票,有的话,像这样的股票总的有多少支 190 | 有哪些城市在上一年度的时候他的一个同期成交低于了800套 191 | 我想问问啊就是17年汇冠是为了什么而进行定增的呢 192 | 你知道ISBN号码为9787111601548或者ISBN为9787111601722的内容简介吗 193 | 我就想知道上一周商品房成交不超过17万平的是什么城市,其他的不用 194 | 招聘人数比2名多的岗位中,哪些是要求最低为全日制本科以上学历的? 195 | 请问实达集团它在5月31日的收盘价高于1,那你知道它的市净率是多少吗? 196 | 横店院线这个星期电影票房是2856.8万,你知道电影上映期间观看影片的人有多少吗 197 | 亲,我需要知道一下企业批文数占比低于11%并且进行一致性评价的公司名称 198 | 建筑面积6453平方米的威海鸣翠园住宅楼是哪个公司承建的 199 | 你好,请问一下在2011年人民日报出版社出版的有哪些题名?这当中都有哪些作者? 200 | 你们可以找出有哪些地产类股票收盘价是3元并且跌幅超过10%的不? 201 | 哪些城市去年同期去化时间在1年以上 202 | 有哪些城市本周销售面积大于10并且本周销售套数大于1000的? 203 | 在2018年6月立项的国家社科基金项目有哪些呢,负责人是谁啊? 204 | 你知道凯撒文化公司在16年增加发行新股的目的有多少个吗 205 | 你好啊,12月29号那个有哪些晚间综艺收视率超过5%,市场份额也大于4%的呀 206 | 在本周的一个销售数据中,销售面积不足10,销售量不足100套,是指哪几个城市 207 | 请问12年5月上海有没有什么楼盘容积率大于1并且平均还超过21000平的 208 | 请问中部地区房地产投资金额已高于3000亿,那同比增长可以达到多少? 209 | 诶,你能给我列一下哪些证券是市值在100亿以上的,或者股价超过了10的吗 210 | 我想问问啊就是那个哪些城市在5月20号到26号期间有成交超过1000套二手房的,或者成交超过10万平的呀 211 | 那平江橘郡之前说是有384套房要卖的,那现在有卖出去多少套,就是签约了共有多少套啊 212 | 一共有多少个城市这周新房的销售面积达到100000平以上,或是销售套数超过1000的呀 213 | 最低学历是大专就符合的职位中,哪些只招3人? 214 | 诶,那个天神娱乐在15年进行定向增发目的有几个啊 215 | 诶,有几个亚洲航空公司18年的时候PE会大于10,并且啊PB也会大于1的呀 216 | 深振业A的11EEPS是小于1的,那11EPE是多少你知道吗? 217 | 11年每股收益多少的股票股价大于10块或者净负债率大于100 218 | 你好,我了解到中南建设这家地产公司2011年每股收益是不足1的,那你知道2012年每股收益大概的数值吗? 219 | 你知道有哪些电影院这周票房超过100万并且观影达到1万人次的? 220 | 光纤陶瓷插针连接器的研发这个项目是13年,我想问是哪个公司承担的 221 | 换手股成交额不足9亿的多吗,成交收盘价又达到了多少 222 | 我想了解一下就是银河地产现在持股数量在100万股以上并且最新市值也达到了1百万元以上,同时它的市值比重也超过10的模拟组合都有哪些呢? 223 | 请问圆通这家公司的收市价是多少啊,我看到它所有股票的市值已超过了300亿 224 | 请问一下哈,在16年有哪些作品是获得了一等奖的呢 225 | 诶,你知道15年为了项目融资而增发的二六三证券的倒挂率是多少来着 226 | 本周销量大于1000套并且本周销量大于10万平米并且销量环比大于1的城市一共有多少? 227 | 你帮我查查看有哪些沙漠超过5万平方公里的呀,这些沙漠都位于哪呀 228 | 有哪些项目牵头承担单位的项目实施周期为5年并且中央财政经费大于5000万元的? 229 | 有哪些年级专业的考试科目是高等数学一并且人数大于5的? 230 | 我想问问啊就是市值在30亿美元以上的,而且是台湾的都是哪些被动元器件制造公司啊 231 | 蓝色光标2018年预估每股收益不足1,那2019年的预估每股收益是多少呢? 232 | 满足17年的产量超过50万吨或者生产成本超过100亿的共有几家上市钢企 233 | 2011年每股收益大于1块或者本益比大于10%的股票代码是多少 234 | 股价低于9.9的公司是哪个 235 | 哪些事故发生在2014年或者死亡人数超过1人的 236 | 所有电子工业出版社出版的书中,哪些是于2012年1月出版? 237 | 目前生产线的数量小于20条或总产能小于200的有哪几个企业 238 | 你知道15年定增的天神娱乐增发目的有几个吗 239 | 这次需要需进行一致性评价的企业要求批文数占比要低于11%,这样的企业有多少 240 | 我想知道哪些年京沪高铁净利润有超过50亿的,或者平均每天客流量超过20万人次的呀 241 | 请问一下哪个公司的股票价格在9块9以下的 242 | 2016年12月人民出版社出版的书是什么 243 | 在那个福田旅检作业存放点货物数量超过10个以上的都有哪些呢? 244 | 什么公司在2017年6月5号生产了45度的浓香荞麦烧酒 245 | 在房地产开发施工面投资完成额低于1000块或者其他费用小于30000的情况下,房地产开发投资完成额平均可达到多少 246 | 一线城市去化时间去年同期超过1年的城市有哪些 247 | 中国社会科学出版社在2015年12月出版了几本书 248 | 所有中大牵头的项目中,哪些的财政经费是比1500万多的? 249 | 股价低于5角或者市值不足100亿的股票属于哪些公司 250 | 股价大于4.5而且总市值大于450的公司是哪个 251 | 请问在08年住宅供应面积达到10以上,那你知道成交的住宅面积大概有多少呢? 252 | 你帮我查一下那个新开普在15年的时候啊增发价格是多少啊 253 | 对的对的,我想查一下持股数量和模拟组合名称,就查市值比重在30%以下的 254 | 溢价率小于0的股票投资评级是什么或者涨幅不足20%的股票投资评级是什么啊 255 | 我想咨询一下汽车电子板块里都有哪些股票它的PE-TTM多于10而且PB也大于1? 256 | 你知道住宅用地成交宗数大于0,成交面积大于10万平以及楼面价一平大于1000的溢价吗 257 | 你知道哈尔滨市新阳支行它在网点预约分配出去的额度有多少吗,我只查到它在网络上预约的额度是已多于10000枚 258 | 2002年1月份买了几台显示器 259 | 请问有哪些开发类的地产公司股价是超过10且总市值达到100以上的? 260 | 17-20E股票最小增长率为多少时它的2017年股息率大于1或者企业价值倍数大于10 261 | 我想问问你啊就是证券收市价超过5,增发的价格也高于50的都是什么证券 262 | 你好啊,能帮我就是查一下那个11年周均成交量就超过10000的一线城市,上周完成了多大成交量啊,两者相比,比重多少啊 263 | 周涨跌幅在1以上的,且总市值高于20亿元的有什么股啊 264 | 这些兰色印染布的生产日期是2013年8月,是什么公司生产的啊 265 | 最新股价的最小值为多少时刚好可以满足股票2011年每股收益大于5角或者本益比大于20% 266 | 深圳南山什么时候它土地出让面积不超过1并且容积率达到10的? 267 | 想要了解2018Q1大于10的公司及其2018Q2的情况是怎样的 268 | 成交宗数大于0,成交面积大于10万平以及楼面价一平大于1000的住宅用地溢价为多少 269 | 东莞在2011年日均成交量超过1,那2012年的呢? 270 | 我想知道15年VLCC型的船现在有多少艘是船龄与船价的比达到60%的 271 | 你帮我查一下这个礼拜成交面积在45200平方米以下的是什么城市吧 272 | 你好啊,17年定增,并且增发目的还是项目融资的都是哪些证券啊,证券代码是啥啊 273 | 能给我列一下都有哪几个城市其同比增长在100以上,或者是环比增长超过了1的 274 | 请帮我问问有哪些城市本周销售面积大于10并且本周销售套数大于1000的? 275 | 你知道生产日期或批号为43191或者抽查合格的产品名称吗 276 | 13级作物1班中有2人需要重修的是哪门课程? 277 | 你好,你帮我看一下那个12年每股收益估值在1元以上的招商地产它13年每股收益又将会达到多少呢? 278 | 最近1周,哪些城市的日均成交量是超过200的 279 | 请问氯霉素检测最大值为0.3的样品有什么? 280 | 我想问问啊那个东港线啊,就是那个运货路长超15千米的东港线啊,它起点和终点是哪你知道吗 281 | 我知道还问你吗,我就想知道一下本周和上周的一个成交面积情况有那么难吗,都说了同比低于110 282 | 投资组合2012年5月28号收益超过10块或者股份低于100手的市值多少 283 | 近4周周均成交环比大于3并且同比大于30的重点城市有哪些呀? 284 | 哪些电影院2019年1月14到1月20期间单日单厅票房高于1000块钱或者单日单厅场次大于6场的 285 | 我想请问一下我之前吧定期半年利率是3.3,那调整之后呢 286 | 20亿元以上的总市值,都有哪些股啊,代码多少来着 287 | 你知道全球物流自动化系统销售收入大于30亿美元的同比增长率最高的时候是多少吗 288 | 请问蓝色光标的18年预估每股收益不足1,那2019年的预估每股收益你知道是多少吗? 289 | 诶,你帮我查一下就是哪些影片累计票房超过了2亿的呀,那这些影片平均每场人次达到多少啊 290 | 请帮忙查询有哪些航空公司国内客运量占比大于10%并且市值大于100亿元的? 291 | 你好啊我想了解的是11年出版的书的名字 292 | 哪些股的总市值在20亿元以上,并且啊周涨跌幅超过1的呀 293 | 北京区域成交数值小于25的是表示哪个参数或者是上海的数值低于10 294 | 帮我找找,在北大那边的财政拨款高于5万的有多少个项目 295 | 对呀,巨人网络目前的收盘价是19.72块钱,那你可以帮我查一下那个巨人网络是为了什么而进行定增的吗 296 | 2016A对锂电池的需求量达到20以上,那对三元电池的你知道是多少吗? 297 | 请问一下2018年度在湘雅二医院有哪些重点研究的项目,这项目的主要负责人有谁呢? 298 | 股票的涨幅小于20.1%或者溢价率小于0,该怎么投资评级 299 | 我想了解都有哪些公司的公示金额超过10000元的而且人数也超过100人的?都是在哪个区的呢? 300 | 你好,帮我查一下2018年7月份抽查的商标代理违法行为的任务编号 301 | 你知道土地面积大于5000平或者建筑面积大于3万平的容积率吗 302 | 那个电视剧集数超过30集的而且发证日期在2017年1月25日的剧名有哪些呢,他们的制作单位又有哪些呢 303 | 容积率多少的土地面积大于5000平或者建筑面积大于3万平 304 | 你好啊,你帮我看一下啊倒挂率超过0.3的是什么证券啊 305 | 所有招3人的职位中,哪些是需要最低大专学历就可以的? 306 | 我了解到托中股份它的收盘价已高于10,那涨跌幅是多少? 307 | 你帮我查一下那些在10年十二月出版的,售价达到15块的书叫啥名吧? 308 | 哪本书是红旗出版社在2015年11月出版的 309 | 你好,帮我查查本月涨跌幅大于-2并且年涨跌幅大于-20的交运总共有多少个? 310 | 请问西部城市的成交大于2并且近7日成交大于20的7日成交同比最大有多少? 311 | 有哪些上市银行收盘价大于6元/股或流通市值有611.12亿元的? 312 | 业务量54.27亿件的韵达股份,其快递业务营收是多少 313 | 哪些机场在2015年到2019会进行扩建或者扩建预算是65.5亿 314 | 哪些电影和歌曲是1934年的 315 | 诶,你知道那些在17年增发新股,倒挂率还达到50%以上的公司叫啥名吗 316 | A股价格大于9.4的公司简称是什么 317 | 出现次数超过8万,频率高于0.1的都是哪些词啊 318 | 北京市启迪致远婴童用品有限公司在2017年2月4号生产了什么 319 | 我想知道那些增加发行新股价格在10块以上,还是在15年定增的公司数量 320 | 麻烦请告知在上一周房地产成交量高于1000而且环比小于10的城市谢谢。 321 | 想要了解香港市场重点房地产公司有哪个的股票现价是小于2.4的吗 322 | 等会你帮我看看本月涨跌幅大于-2并且年涨跌幅大于-20的交运总共有多少个? 323 | 什么项目需要不止5千万的经费? 324 | 你们哪些岗需要招硕士及以上的,并且要招3人以上的呀 325 | 一共有多少城市本周销量大于1000套并且本周销量大于10万平米并且销量环比大于1的? 326 | 出版社是电子工业出版社且出版日期是2012年1月的书是哪些? 327 | 诶我想问问啊就是19年第四个礼拜可以在多个平台上观看的,并且点击量也超5亿的剧共有几部啊 328 | 哪些公司预计20年的每股收益小于1,市盈率也小于10的呀,这些公司股价多少啊 329 | 哪些股在2017年的时候成本费就超过90亿了,那其生产数量是多少呢 330 | 请问你知道2011年周均成交超过1000套,还占当年均值比高过100的是什么公司吗 331 | 麻烦帮我查查有什么项目的给的资金是3万而且研究时间超过1年以上的,还有单位有哪些呢? 332 | 当全球物流自动化系统销售同比增长率最大值达到多少时销售收入将超过30亿美元 333 | 请问房地产开发投资在2012年1-5月累计数大于1000,那你知道同一个时间段的同比增速是多少吗? 334 | 你帮我算一算16年定向增发的传媒公司数量 335 | 15年定增,并且是为了项目融资,想知道二六三它的倒挂率多少啊 336 | 那些溢价率达到-30%以上或者涨幅大于11%的股票,你知道他们的投资评级是什么吗 337 | 麻烦请告知交运行业在上一周指数达到2000以上和涨跌幅低于2的股票谢谢。 338 | 现在的价格破6000的苹果手机还有几个型号呢? 339 | 我问你啊那个累计票房达2亿以上的都是什么影片,这些影片场均人次多少啊 340 | 什么地区的线路在191.6公里以上的,还有啊是在18年底通车的 341 | 全球物流自动化系统销售收超过20亿美元而且同比增长率大于10%的公司有几个 342 | 铁龙物流2017股息率超过1,那你知道同年分红比例是多少吗? 343 | 我就想问一下那个天丹文化证券,也就是你之前跟我说的那个2016年为了配套融资进行定向增加发行新股的企业,它的代码咋写的呀 344 | 我想问问东部地区销售面积同比增长低于10,那它的销售额同比增长是多少?是涨还是跌的? 345 | 请问哪个经费需求大于1500万的项目是中大牵头的呢? 346 | 想了解都有哪些城市的新房成交销售套数在5月20-26日期间高于100而且销售套数环比小于10? 347 | 请问沙钢企业净资产收益率大于10,那它的季度每股收益呢? 348 | 诶,你不是说那个华南城股最新股价大于0.5吗,还有呢,还给我说说他市值多少呗 349 | 什么公司承担了2013年的光纤陶瓷插针连接器研发项目 350 | 你知道全球物流自动化系统销售收超过20亿美元并且同比增长率大于10%的公司有多少个吗 351 | 我想问那个什么股的总市值会在20亿元以上啊,代码是几的呀 352 | 你好,就是那个最新市值啊有没有超过100亿的证券的啊,或者是股价在10元以上的也行 353 | 土地面积大于5000平或者建筑面积大于3万平的容积率为多少 354 | 93年7月出版的浮士德卖多少钱你知道吗 355 | 哪些书是2018年9月份出版的或者是在2018年12月份印刷的 356 | 你好,请问一下有哪些省份资产负债率大于10%并且股息率大于1%的? 357 | 在北京展出且展览面积小于2万的展会是哪些? 358 | 你帮我查一下12年每股盈余大于1的,市盈率也高于10的有多少家公司啊 359 | 诶,你知道就是销售单价低于1万一平的都是什么地产公司啊,那销售单价同比又是多少来着 360 | 怎么对2011年每股收益不足1块或者本益比不足10%的股票进行评级 361 | 我想咨询一下就是南京仙林在2007年12月6号出让的土地面积已经高于10了,你知道它的楼面价最高的时候是多少吗? 362 | 请问哪些招1个人的职位是需要最低本科学历的? 363 | 请问月环比的一个涨幅大于1并且5月的那个均价大于3万元/㎡的楼盘有哪些? 364 | 项目数小于20以及项目土地面积大于20552亩的土地综合推介会开在几个地方啊 365 | 诶诶,我问的是深圳12年5月的时候的,就是问5月深圳哪些楼盘是大于2万每平的,或者是深圳哪些楼盘房价5月比上月上涨幅度高于10的 366 | 了解到西向的生态填埋场需要招聘3位机修人员,想问一下他们想要招多少岁的 367 | 你好啊,有几家公司11年的每股盈余低于5毛,市盈率也低于20倍的呀 368 | 检测氯霉素的样品中,哪几个检测最大值不能超过0.3? 369 | 学历最低需要本科且只招1个人的岗位是哪些? 370 | 你知道三五互联公司在15年定向增加发行新股的目的有多少个吗 371 | 你好我想查一下对外经济贸易大学出版社出版的岳洪锦主编的出版日期是2014年8月的实用警务英语在哪家图书馆可以找到 372 | 你知道在福田旅检作业存放点的货物数量达到10个以上的有哪些吗? 373 | 股票的重估净资产多少时,股票收益比率可以超过20%以及2011年每股收益大于0.5 374 | 请问青岛市12年1到5月这段时间它的房子成交面积已超过500,方便跟我说一下同比11年大概是怎样一个情况吗? 375 | 本益比小于40%或者每股收益不足5毛的股票,总的股价是多少 376 | 帮我查一下国航4月的正点率,我只知道5月份的是已超过0.55了 377 | 2016年3月份文联社出版的书有哪些 378 | 请问所有需要最低学历为本科的岗位的岗位代码中,哪个是招1个人的? 379 | 你好啊,你帮我查一下售价1万以下每平的都是哪些香港上市地产公司啊,还有那那这个单价同比多少啊 380 | 所有展览面积小于2万的展会中,哪些是在北京展出? 381 | 福州哪几年成交住宅土地宗数超过10面积超过100万平 382 | 哪些项目的工程投资超过20亿且输电线路超过1200公里以上的 383 | 你好,请问一下在2018年11月有哪些企业总产能大于100万吨并且产能占比大于10的? 384 | 每股收益不足5毛或者本益比小于40%的所有股票的股价总和为多少 385 | 楼盘均价大于21000平的楼盘是哪个 386 | 你好啊,那个15年定增,而且啊增发目是做项目融资,这个二六三证券它那倒挂率多少啊 387 | 你知道哪些书是哈尔滨出版社在13年1月份的时候出版的呀 388 | 本周涨跌幅低于01的股票的代码是什么或者是本周指数超过4000的股票代码 389 | 你好,我想知道一共有多少所美国学校排名在世界前10 390 | 2018年下半年开工的项目里哪个项目计划投资超600亿 391 | 股票周涨跌幅低于15%的公司是哪些,所对应的代码又是多少 392 | 有没有持股比例大于20%或者投资金额大于8亿的公司 393 | 诶,你给我就是说说那个08年12月的时候啊青岛住宅期房成交了有多大面积的呀 394 | 哪些电视剧的集数有30集以上的并且在2017年1月25日发证的,还有制作单位都有哪些呢 395 | 学历要求为本科及以上就符合的所有岗位中,哪些只招5人? 396 | 有哪些公司市值有1369.38亿元的或者周涨跌幅小于3%? 397 | 能跟我说说哪几家公司的市值在100以上啊,或者是股价在10以上的 398 | 我想问问啊就是有几家公司市值超过100亿的,并且股价在10以上的呀 399 | 哪些城市的成交面积本周超过了15万平或者上周超过了14万平 400 | 哪一年通车的济青高速投资额是308亿 401 | 招聘人数超过1人并且学历是本科以上的部门有哪些? 402 | 你好啊,那个哪些证券最新收盘价大于5,增发价格也大于50的呀 403 | 商品房竣工不超过10亿平的竣工率怎么样啊,还有这些商品房投资了多少啊 404 | 有哪些股票的市盈率不足41%,麻烦把代码也说一下,谢谢 405 | 你知道建设内容为建设综合商务中心或者农产品精深加工产业园或者计划投资超过60000万元的项目名称有多少个吗 406 | 2015年12月中国社会科学出版社出版的书有几本 407 | 我想知道就是哪些公司其市值会高于500亿,或者是PB大于2的呀,呃还有那个股本已经超过50亿股的也告诉我一下吧 408 | 诶,上周五几个综艺是在湖南台放的呀,并且啊还有超过0.3%的收视率 409 | 总共有多少传媒股B收盘价大于10并且B涨跌幅大于1的? 410 | 2018年11月行业前5家企业中总产能大于100万吨并且产能占的比例大于10%的企业有哪些? 411 | 请问有哪些城市前一周成交超过1000并且环比也大于10的? 412 | 总股本超过17或者市值超过100亿的股票有哪些 413 | 诶你知道有哪些书是11年12月在商务印书馆出版的吗 414 | 批文数占比大于3%并且批文数等于1600需进行一致性评价企业数是多少 415 | 请问一下营业收入超过1亿美元,营收同比增长速度超过20%并且占总的营收的比例大于10%的项目有哪些? 416 | 你知道场均人次大于10或者平均票价大于30块的电影环比变化是多少 417 | 那个电视的综艺播放数量超过5000万的,还在芒果台上播放的综艺叫什么啊 418 | 有多少个地产公司其市值高于300亿,并有超过30亿股的呀 419 | 需要研究生硕士且只招1个人的岗位是来自哪些部门的? 420 | 麻烦问下有哪些公司2011市盈率超过20且平均市净率估值超过2的? 421 | 2015年1月份由北京时代华文书局出版的书叫什么 422 | 我就想之后调整之后原本定存半年的利率是3.3的,现在的利率是多少 423 | 哪些高速公司持股比例大于20%或者2018H1投资收益大于1300万 424 | 麻烦请问一下总共有多少个重点城销售套数5月27日至6月2日大于1000套并且销售面积5月27日至6月2日大于10的? 425 | 你知道19年1月7日到13日这周票房高于1000万以及场均大于10人次的影投公司有多少家吗 426 | 请问有哪些城市土地成交建筑面积超过100万平米并且成交累计同比达到10%以上? 427 | 有几家那个教育行业的公司啊就是17年为了配套融资和那个融资收购其他资产而进行定增的呀 428 | 你知道交运行业有哪些证券在这周的指数达到1000以上,而且涨跌幅也高于1的吗? 429 | 那个,在2012年满足每股收益大于1块或者本益比大于10%的股票中,股价最低的是多少 430 | 请问财政经费超过5千万的项目有哪些? 431 | 威海市鸣翠园这个住宅楼有6453平方米的建筑面积,想问一下这个住宅楼是什么公司建的 432 | 五月均价超过41000平而且月环比涨幅超过4的楼盘是哪个 433 | 有哪些部门的招聘人数超过1人并且学历是本科以上的? 434 | 11年H1没有20个月,H2还没有1年,去年同期数咋样 435 | 你知道那些15年以配套融资目的进行定增的证券代码是啥吗,都是什么证券啊 436 | 我想了解一下销售面积同比增长小于10和销售面积绝对数高于100的地区主要都在哪里呢? 437 | 北大出版社2013年出版的书籍有哪些呢? 438 | 2011年最新股价多少啊,已知改股票的每股收益超过5毛以及股票收益比率大于20% 439 | 我想知道15年为了配套融资而增发新股的公司叫啥名啊 440 | 那个深圳5月份的时候啊有哪些楼盘是2万以上每平的呀,或者月环比涨幅大于10的呀 441 | 大专以上可报且招聘人数少于3个的岗位有哪些? 442 | 所有招1人的科室中,哪些需要最低学历是本科的? 443 | 交通展区中哪些项目的金额总数是8万? 444 | 你好,你可以帮我算一算倒挂率高于60%,还是在15年增加发行新股的公司数量吗 445 | 如何对溢价率超过-30%或者涨幅高于11%的股票进行投资评级 446 | 有没有二手房成交了有1000套以上的或者成交超过276135.60平的城市啊,有的话,都是啥城市啊 447 | 你帮我查一下在15年为了配套融资进行定向增发的公司数量吧 448 | 哪些证券最新收盘价大于5,或者增发价格大于50的呀,那个增发目的是啥啊 449 | 2016A股市盈率大于22,股价和市值分别为多少呀 450 | 请问你一下啊2019年的第4周的时候中影那个星美的那个观影的人次是多少呢,就是还想知道电影票价格平均下来大于35块钱的电影院线的观影的人次的情况 451 | 我好想知道低于16000万平方米的建筑项目出让时间是什么时候 452 | 10年出版的书有什么? 453 | 环比数低于15的是哪些城市,在上周成交了多少面积 454 | 当房地产开发投资完成额均值达到多少时它的施工面投资完成额低于1000块或者其他费用小于30000 455 | 我了解到在2017A对锂电池的需求量已达到20以上,那对磷酸铁锂和钴酸锂的需求量又会是多少呢? 456 | 你知道深高速PE19E是多少吗,我只查到它PE18E的是已高于1 457 | 哪些样品中检测氯霉素的最大值为0.3? 458 | 票均价高于10美元的,或是票房高于10093百万美元的国家占了几个 459 | 我想知道湘雅二医院2018年的时候重点研究的项目是什么,项目的主要负责人是谁呢 460 | 在表中,西部城市日成交大于2并且近7日成交大于20的7日成交同比最大是多少? 461 | 由北大出版社出版且是2013年出版的书有哪几本? 462 | 你知道分值低于10分或者评分标准是1、未纳入总体工作和年度工作计划的,扣2分。2、未建立领导机构或明确职责的,扣2分;3、未制定方案,扣2分;4、平安创建无部署、检查和总结的,扣2分的项目有多少个吗 463 | 想查一下有没有投资200亿以上主要生产LCD驱动芯片的LCD驱动芯片 464 | 你好,可以跟我说一下教育行业里有哪些证券的最新收盘价高于5元而且倒挂率超过50%的吗? 465 | 我想知道2018年11月出版的车载激光测量数据智能后处理技术:SWDY深入解析与应用的页数 466 | 你帮我算一下那个今年第四个星期有多少部剧播放数量在5个亿以上,并且可以在多个平台上播的呀 467 | 想了解房地产有哪些指标是绝对量高于100,同时同比增长达到1%以上的? 468 | 你好啊,那个我想问啊代码3026的禾伸堂,就是那个在台湾的,它17年营收平均有多少啊 469 | 我发现春秋航空在PE2018E是不超过20的,那EP2019E呢? 470 | 你知道有哪些证券的收盘价格是高于10元同时这个月的收益率不超过1%的吗? 471 | 2002年1月份开工并且在2008年4月份全部建成投产的项目是什么 472 | 收盘的价格高于10元,并且涨幅超过20%的公司 473 | 10年的每股收益大于1元或者本益比大于20%的股票有几只 474 | 像每股收益不足5毛或者本益比小于40%这样的股票,我突然有个大胆的想法,他们的股价全部加起来有多少 475 | 哪些公司的2016A每股收益大于5角或者2016A市盈率低于50% 476 | 11年一期房价超过1200一平并且二期超过1100块的城市有哪些 477 | 企业类别是A类且统计报关单数比4000多的企业都是哪些? 478 | 麻烦请告知铁龙物流2017分红比例是多少谢谢,我了解到2017股息率在1以上。 479 | 我发现沙钢企业净资产收益率是超过10的,那你知道它季度每股收益是多少吗? 480 | 占比大于3%的批文数而且批文数等于1600需进行一致性评价企业数有多少 481 | 在每星期只工作8小时的单位中,哪些招10个人? 482 | 请问有哪些企业的违法车辆数超过1辆并且违法情况为未处理? 483 | 2012年成交了2宗住宅土地,那么成交的住宅建筑面积是多少 484 | 请问国内钢企有哪些证券净资产收益率是超过10并且季度每股收益也大于1? 485 | 招聘人数为1人且学历最低为本科就符合的岗位是哪些? 486 | 有哪些院线今年1月14号到20号的总票房达9065.87万或者票房占比高于5%的? 487 | 你好啊,今年第1周播放量达4000万以上,还在腾讯上播的一共有多少部网综啊 488 | 你知道毕业实习(52)这门课程或者学分大于2分的课程备注吗 489 | 你知道达美辅助收入占总收入比重的多少吗?已知营收已高于10亿美元而且总乘客数量人均在100以上了。 490 | 你好,那个新疆维吾尔有哪些沙漠面积是达到2万平方公里以上的呀 491 | 商标代理违法行为检查在2018年7月份进行,能不能告诉我抽查的任务编号啊 492 | 我想知道16年为了配套融资增发新股的公司叫啥名来着 493 | 2011年每股收益大于5角或者本益比大于20%的股票,最小股价为多少 494 | 麻烦请告知龙湖地产2011年每股盈余大于1块的情况下,本益比是多少谢谢。 495 | 你好,那个15年增发新股的三五互联公司有多少个目的呀 496 | 哪个一线城市日成交高于200而且环比高于20的 497 | 哪些公司的股份超过100手或者市值超过32万 498 | 北京金泉港国际影城观影达到1万人次,那场均人次又是多少? 499 | 你好,你给我讲一下那本16年5月份出版的明史演义的主要内容呗 500 | 有几个公司的全球物流自动化系统销售收超过20亿美元并且同比增长率大于10% 501 | 你好啊,15年为了配套融资增发的都是哪些证券啊,代码多少啊 502 | 当住宅用地溢价为多少时它的成交宗数大于0,成交面积大于10万平以及楼面价一平大于1000 503 | 请问兴森科技这个公司在2016年总收入达到20亿以上,那复合年均增长率是多少呢? 504 | 帮我统计一下全球物流同比增长率大于20%或者销售收入大于2000以上的公司有哪些? 505 | 请问一下总共有多少三线城市2011同期大于100并且2012至今大于10的? 506 | 我想知道三大航的总市场份额超过0.7的机场有多少? 507 | 我想问问啊就是12年6月哪些地产公司的市值会小于100亿,或者股价低于10的呀 508 | 我想问一下2017年宝鸡市眉县首善镇三寨小学综合实验楼项目的投资额度 509 | 帮我看一下有多少只股票11年每股税后利润是多于2角钱一股 510 | 有哪些城市上周成交超过1宗并且成交面积高于10万平方米? 511 | 嗯嗯,其它不用了,你就帮我查一下股价超过17块的模拟组合就行,谢谢了 512 | 我想问问那个上周股价大于0.5的华南城股市值多少啊 513 | 你好啊,我想问问就是检验钟表哪些参数收费超过400元的呀 514 | 请问需要最低本科学历的岗位中,哪些只有1个录用名额呢? 515 | 面积超过5万平方公里的都是什么地方的什么沙漠呀 516 | 请问一下综艺收视率超1%而且是星期日播的台是什么台? 517 | 可以查得到最新市值和最新股价吗,最新市值超100亿最新股价大于10块钱的证券,证券的代码是什么 518 | 想要了解一下北京2012年5月楼盘均价大于21000平的楼盘 519 | 股价最大值为多少的股票18E每股收益大于1块或者18E股票收益比率大于10% 520 | 请问哪些比50贵的书是北大出版社出版的呢? 521 | 你好,请告诉我融创中国EPS2013E是多少谢谢,我只知道它EPS2012E已达到1以上 522 | 请问哪个城市的日成交超过2而且成交环比超过20 523 | 麻烦帮我看看,18年中信出版社出版的书叫什么? 524 | 诶这本2016年5月出版的明史演义你帮我查一下它主要讲述了什么吧 525 | 那个北京房山的保护区面积没有超过5000? 526 | 你好,咨询一下平均售价超过2万块每平的楼盘装修标准以及价格和其它楼盘相比是否持平 527 | 我了解到深高速它PE18E是大于1的,那PE19E你知道是多少吗? 528 | 你好,麻烦请告知在前一周成交达到1000以上同时环比不低于10的城市谢谢。 529 | 有哪些地产公司销售面积大于100或者销售面积同比大于10或者销售单价大于10000的? 530 | 哪种产品是河南省的智信染织有限公司在2013年8月份生产的 531 | 什么项目的预计投资金额比1千万多? 532 | 2006年1月份通车的江中高速的车流量增速是多少 533 | 请问 534 | 535 | 请问近4周周均成交环比大于3并且同比大于30的重点城市有哪些呀? 536 | 你知道今年第四周有多少部国产动漫的播放量在3千万以上的吗 537 | 18年12月19号收盘价格超过4元的证券有吗对应的代码是什么 538 | 麻烦咨询一下18冬春航班数量大于10000并且航班占比大于10的净利润最小是多少? 539 | 想咨询一下就是在2017A锂电池需求量已大于20了,你知道对磷酸铁锂和钴酸锂的需求量是多少吗? 540 | 有哪些矿床的品味是达到35%的 541 | 你好,请问本周的票房达到2856.8万的横店院线,观影达到多少人次啊 542 | 保利地产公司股11年每股盈余超过1元,那它12年的每股盈余又会是多少呀 543 | 京沪高铁在2017年的客运量是1.8亿,你能告诉我它的净利润吗 544 | 那个苏州平江区的橘郡不是在4月的时候开盘了近380套吗,那现在呢,现在卖出去几套了呀 545 | 你知道有哪些重点城市近4周周均成交环比大于3并且同比大于30的吗? 546 | 收盘价大于6块钱或流通市值有611.12亿元的上市银行有哪些? 547 | 请问交通运输行业里哪些股票在上周指数超过2000并且涨跌幅是小于2的? 548 | 你知道在北大那儿有多少个项目拨款是超过5万的呢 549 | 成交收盘价大于7块或者成交量大于18000万手的股票有哪些 550 | 哪些证券是在16年为了配套融资而进行定增的呀 551 | 诶,我问问啊就是哪几家公司的股价高于10块,或者其市值低于100亿的 552 | 有几支股这个星期收盘价是大于20美元或者这周成交是大于2000万股的 553 | 诶你知道买多少张实木扶手椅才超过1万块钱吗 554 | 你好,那个深圳市5月有没有什么楼盘是超过2万一平的呀,或者比上个月上涨超过10的呀 555 | 招聘要求最低学历为本科的所有科室中,哪些只招1人? 556 | 请问一下12年6股票价格超过4块4而且涨幅大于10的哪家地产公司 557 | 你帮我查一下16年为了补充流动资金增发的那些证券代码都是啥来着呀 558 | 有多少本书是四川辞书出版社在2016年1月份出版的 559 | 哪个地区的销售面积同比增长小于10并且销售面积绝对数大于100的? 560 | 你帮我查一下啊那个17年度中国网络作家富豪榜中排名第1的唐家三少有哪些代表作来着 561 | 这个股票应该怎么评级啊,它所有股票的市值低于100亿或者股票交易的几个小于10块 562 | 请问在上一周房地产成交量达到1000以上同时环比低于10的城市都有哪些? 563 | 有几个公司的股票2011年每股收益大于1块或者本益比大于10% 564 | 0601股价多少的股票10A每股收益小于1块且股票收益比率小于20% 565 | 在市桥街这边,有多少所幼儿园的每个月学费超过1千块的 566 | 我了解到东部地区外出农民工总量省内流动已高于1000万人,方便告诉我跨省流动的人口有多少吗? 567 | 江中高速在2006年的1月份开始通车,你知道它的车辆量增长速度吗 568 | 诶,跟我说说现在都有哪些公司的股票总的市值超过200亿而且市净率还大于2的呀 569 | 你知道这次全球排名前10的学校中美国占了几位吗 570 | 我发现香港投资公司最新的股票价值在1块钱以上而且它在本周的涨幅排在前10名,所以是涨了多少? 571 | 你知道11年股价收益比率在20倍以下,每股税后利润也在5毛钱以下的公司数量吗 572 | 那些市销率高于1的股市值多少啊,顺便把股票对应的代码告诉我 573 | 发生在2014年或者死亡人数超过1人的事故有哪些 574 | 2011年每股收益超过1元,市盈率也超过10倍的公司它们的股票价格是多少呀 575 | 所有北大出版社出版的书中,哪些是13年出版的呢? 576 | 所有招聘人数高于3的岗位中,只要本科以上学历就可以的是哪些? 577 | 请问有中大牵头且经费超过了1500万的项目是哪个? 578 | 福州市部分典型降价楼盘售价大于10000或者降价幅度高于10%的,都备注了些什么 579 | 你好,帮我看看持股数量大于150万并且最新股价大于15元的最新市价平均是多少? 580 | 那些收市价超过1.58的股票叫什么并且所对应的股票代码又是什么呢 581 | 我想知道有几只股票的收盘价低于10元每股? 582 | 你好,我想要那本1993年7月出版的浮士德,你说多少钱吧 583 | 济青高速投资了308亿,我想知道什么时候可以通车啊 584 | 你好,请告诉我三元电池在2016A的需求量是多少谢谢,我了解到同年对锂电池的需求量达到20意思。 585 | 哪些13级作物1班的课是2名同学要重修的? 586 | 在2002年1月份开工,在2008年4月份建成的项目是什么 587 | 我了解到蓝色光标EPS18E是小于1的,你知道它EPS19E是多少吗? 588 | 有多少个医院属于东城区或者医院代码为1110008的 589 | 是这样,请问你知道2017年净资产收益率大于10%或者2017年股息率大于1%的股票评级吗 590 | 在10年每股收益超过6角或者本益比大于50%的所有股票中,总市值可以低到多少 591 | 好想知道地产板块换手股的收盘价啊,还想知道周换手率不足21%的股有没有 592 | 我的妈呀,请帮我查询一下有哪些城市,我这边已经知道这周成交面积高于5和上周的成交面积高于11以上的 593 | 房地产开发施工面投资完成额低于1000块或者其他费用小于30000的房地产开发投资完成额均值为多少 594 | 2014年9月通车或者2031年到期的公路有哪些 595 | 韵达的业务量有54.27亿件,那么快递业务营收可达到多少 596 | 营业收入大于1亿美元并且营收同比增速大于20%并且占总营收的比例大于10%的项目有哪些? 597 | 我想知道18级经贸专业中有50人以上的是哪些班 598 | 请问云南城投它的PE12E已超过1,那PE13E呢,是多少? 599 | 2010成交面积超过200的城市有吗是哪个呢 600 | 哪本书是华师大出版社在2011年8月份出版的 601 | 11年每股盈余超过5角的是什么股以及其代码市什么也都帮我查一下,谢谢 602 | 有哪些实验室要买6千只以上的小白鼠 603 | 请问帮我查查哪些地产公司销售面积大于100或者销售面积同比大于10或者销售单价大于10000的? 604 | 你帮我看啊就是12月9号那天收视率大于5%,而且市场份额也超过4%的都是什么晚间综艺的啊 605 | 你能不能告诉我规格型号是JS-100型或者数量超过10的的设备名称啊 606 | 哪些城市在上周的销售面积中是超过了28万平的啊或者去年同期成交超过20万平的 607 | 你好啊,你知道这个星期新房的成交面积超过100000平米,或者成交超1000套的共有几个城市吗 608 | 小于600的产能或者关停时间是在2017年11月15日的有哪些产线 609 | 我国特高压建设输电线路大于1200公里而且工程投资大于20亿的有哪些项目 610 | 你知道12级有哪些专业的总费用是16800元吗? 611 | 请问香港投资公司最新股票交易价格高于1块,同时在这星期涨幅排在前10,具体涨幅是多少? 612 | 哪些公路是2014年9月通车的或者2031年到期 613 | 2012年1-5月全国房地产投资中绝对量高于100同时它的同比增大高于10%的指标都有哪些? 614 | 你把1934年的影片名和歌曲名告诉我一下 615 | 最新每股净资产小于7块的有哪几家公司 616 | 这次世界排名中排在前10的学校中有几所是美国的 617 | 有几个项目的分值低于10分或者评分标准是1、未纳入总体工作和年度工作计划的,扣2分。2、未建立领导机构或明确职责的,扣2分;3、未制定方案,扣2分;4、平安创建无部署、检查和总结的,扣2分 618 | 你知道北京金泉港国际影城在第7周平均每场多少人次吗,我只知道它观影已超过1万人次了 619 | 股票成交涨跌幅小于2股票有哪些 620 | 总共有多少个重点城销售套数5月27日至6月2日大于1000套并且销售面积5月27日至6月2日大于10的? 621 | 哪些模拟组合的最新股价是比17块高的 622 | 交通展区中8万的项目有哪些? 623 | 请问在2011年股价收益比率不足20或者每股的收益是小于0.5的股票是哪些公司的 624 | 2019年1月14日至18日股价大于4块钱而且市盈率大于40的代码是什么 625 | 哪些影投公司18年票房高于10亿,或者影院数超过100的呀 626 | 出版社是中信出版社且是在2017年8月出版的书是哪本? 627 | 了解到东方航空PES2018E是不超过1的,那你知道他现价大概有多少吗? 628 | 那些发生在2014年或者死亡人数超过1人的事故名称,麻烦你告诉我一下 629 | 你好,请帮我查一下每股价格高于20元,或是市值超200亿的公司简称,谢谢 630 | 那个就是共有几个重点城市在5月27到6月2这段期间卖出了超过2000套,或者是卖的面积大于20万平的呀 631 | 请问一下在2011年北京人民日报出版社出版的题名有哪些啊?还有这些作者分别有谁? 632 | 哪些畅销期刊的单价高于10块或者频率大于12或者年价超过120的 633 | 能不能告诉我一下最新每股净资产低于7块的属于哪个公司,谢谢 634 | 想要了解一波有哪些项目实施周期是5年的而且经费给的不超过5000万 635 | 唐镇运管区中什么设备型号的数量为2台? 636 | 福州市2010年成交住宅土地数量达到10宗以上,那成交的住宅建筑面积有多少你知道吗? 637 | 李沧哪个市场测评出来的分数是在200以上的 638 | 请问全球物流同比增长率大于20%或者销售收入大于2000以上的公司有哪些? 639 | 有2人需要重修的课程中,哪些是13级作物1班有的? 640 | 那些总的资产超过100亿或者华文轩证券的净资产是多少啊 641 | 请问交运行业有哪些证券在这周指数超过1000并且涨跌幅在1以上? 642 | 你好,你知道那些17年本益比超10倍,或是每股收益超5毛钱的公司它们的股票平均市净率是多少吗 643 | 你知道检验钟表的参数有哪些是收费超400元啊 644 | 在文锦渡那边存放的数量超过22台的货物都有哪些呢? 645 | 2011年每股收益大于0.5而且本益比大于20%,股票的重估净资产是多少 646 | 请问招考人数为1人且需要学时学位的职位是哪些? 647 | 我想问问你啊就是腾讯上播的有多少部网综在19年第1周的时候播放量就达4000万以上的呀 648 | 请问2012年房地产中有哪些指标绝对量大于100并且同比增长还低于10%的? 649 | 中南建设这家地产公司2011年每股收益低于1,你知道它2012年每股收益是多少吗? 650 | 12年十月9号这天谁捐了2本以上的书? 651 | 我想知道16年联创互联证券定增的目的是什么 652 | 你知道英飞凌业务收入2018年大于13亿欧元或者2017年大于10亿欧元的指标有多少个吗 653 | 你帮我数数那个15年定向增发的天神娱乐有多少个增发目的啊 654 | 哪本书是北京时代华文书局在2015年1月份出版的 655 | 湖中宝总股本已达到50亿股以上,那你知道它每股预收是多少钱吗? 656 | 15年定增的,增发价格又低于30的都是哪些证券啊 657 | 请问最低学位需要硕士的岗位中,哪些有3个以上的录用名额? 658 | 单价高于10块或者频率大于12或者年价超过120的畅销期刊有哪些 659 | 16年那个凯撒文化公司有几个增发新股的目的啊 660 | 北京5月份有哪些楼盘售价在3万以上的呀 661 | 你好,那个要买几张实木扶手椅才花到1万以上的呀 662 | 成交同比高于66的城市有哪些 663 | 请问你知道总共有多少个土地使用权人的缮证日期为2011年11月29日并且使用权面积超过10000的吗? 664 | 在18年底通车的,线路长度大于191.6公里的沿线的地区是啥 665 | 17年的每股盈余超过5毛的公司它们的市盈率平均下来会是多少呀 666 | 那个市桥街那儿的幼儿园每个月学费超过1千的有多少所呢? 667 | 青岛到连云港沿线地区线路长超100公里的有哪些 668 | 什么时候开通那些投资超过200亿的高铁线路啊,还有就是线路是从哪个城市开往哪个城市 669 | 销售环比大于0或者销售同比大于-45的二手房上个周的销售总和是多少 670 | 朋友说西向填埋场在招机修工,而且只招3人,那对年龄有怎样的要求啊 671 | 中国商业出版社在2008年12月出版的书,你能不能帮我查一下它们的正题名 672 | 想了解一下股票周涨跌幅低于15%的公司和代码,求解,谢谢 673 | 这周成交面积超过5或者在上星期成交面积超11的,符合条件的城市请帮我列举出来,谢谢 674 | 溢价率高于-30%或涨幅高于11%的股票投资评级是什么 675 | 股票10A每股收益大于5角并且10A本益比超过20%或者总股本超过30亿股的股票都有哪些 676 | 红旗出版社在2015年11月份出版了什么书 677 | 河北哪些项目总投资超过1000000元 678 | 5月20号到26号的二手房成交超过1000套的,或者成交面积超过10万平的都是哪些城市啊 679 | 我想问一下就是上海在12年5月的时候啊售价超过2万一平,比起四月涨幅超过3的有几个这样的楼盘啊 680 | 对于机械行业主要上市公司的估值,股价达到18元以上,我想了解一下各个公司的名称以及代码 681 | 股票年涨跌幅是小于12%的燃料电池公司叫什么啊 682 | 我想问呃那个预计20年的每股盈余低于1,或者市盈率低于10的都是什么公司啊,他的股票多少钱一股啊 683 | 销售面积大于100或者销售面积同比大于10或者销售单价大于10000的地产公司有哪些? 684 | 你好,请告诉我房屋可出售数量在1000以上而且可售环比也在1以上的城市,谢谢。 685 | 你好,我查询到春秋航空它的PE2018E是小于20的,那它在EP2019E会是多少呢? 686 | 我了解到奇台路兵团支行的营业处分配在线上的额度在100张以上,线下呢,有多少啊 687 | 我查询到申通它的股票交易价格已超过15块钱,那你知道它本益比是多少吗? 688 | 我想知道有哪些证券它的股票价格多于10块钱还有他所有股票的市值高于100亿? 689 | 哪些公司的股价超过18元以上,公司代码是什么啊 690 | 你好,请问有哪些机器人厂商在2016销量市占率大于5%并且2016销量大于5000的? 691 | 我就想问一下啊,现在呢我这里呢是知道一个这样的数据,就是最近8天平均每天的环比数小于22或者去年同期28天的日均环比小于100,那今年的同比和环比有关系吗,同比是多少呢 692 | 成交住宅土地低于300或者成交住宅建筑面积低于170万平,那它的每宗土地平均面积是多少啊 693 | 请问哪本中信出版社出版的书的出版时间是2017年8月? 694 | 帅哥,股价和市值啊,2016A市盈率大于20的股票股价和市值分别是多少啊,说了n遍了 695 | 在2011年,有没有每股收益大于1块或者本益比大于10%的股票,告诉我他的代码 696 | 你好,请问你知道2017年股息率大于1或者企业价值倍数大于10的股票17-20E的增长率最小值吗 697 | 2017年股价收益比率大于3倍,资产净收益率大于10%以及平均市净率大于1倍的股票股息率为多少 698 | 请问那个都是什么证券啊,就是15年定增,然后呢那价格又低于30的呀 699 | 诶,你知道那个有哪些证券12年预计每股收益会大于1,并且本益比也大于10的呀 700 | 成交面积连续两周的变化比不足15,那在上周成交了多少啊 701 | 你知道万科总市值高达多少吗?我知道目前它的收盘价超过5元了。 702 | 你好,请问销售面积同比增长低于10而且销售面积绝对数超过100的主要集中在哪些地区呢? 703 | 楼盘均价下于4万一平的是哪个楼盘,他的容积率是多少 704 | 你知道目前有多少是在15年进行定向增发,倒挂率还大于0.6的吗 705 | 2011年每股收益大于5毛或者股票收益比率大于20%的股票平均市净率是多少 706 | 诶,你知道那个汇冠17年的增发目的是什么吗 707 | 请问有哪些项目的实施周期是5年的并且项目经费超过5000万元的 708 | 你好,请告诉我股票的价格高于10块钱并且总的市值超过100亿的证券谢谢 709 | 请问哪些机构是在98年被批准的? 710 | 想了解09年福州平均每宗的土地面积是多少,我只知道它成交住宅建筑面积大于100万平米。 711 | 哪几家公司在最新的净资产中每股不足7块的 712 | 你知道市值大于100亿或者收益大于5000万的股票2018年第三季度的最大营收同比增速吗 713 | 哪些城市的二手房成交套数超过了1000或者成交面积大于276135.60平 714 | 麻烦请告知国内钢企净资产收益率在10以上而且季度每股收益也高于1的证券谢谢 715 | 我想知道这些证券代码,就是呃11年EPS超过1,或者月涨跌幅超过10的 716 | 哪些书是文联社在2016年3月份出版的 717 | 所有最低学历为本科的职位中,哪些招1人? 718 | 你知道什么书的出版时间是10年的12月份吗,而且这些书的定价还都是15块钱? 719 | 矿种储存超过50万吨的是什么矿或者面积大于1平方公里的矿区有什么矿 720 | 哪些公司的股票每股收益超过了1或者本益比大于10 721 | 西北省市这不是实施保障房计划嘛,我想知道关于2012年的1个十二五规划情况啊 722 | 新开普15年增发的价格是多少来着 723 | 你可以告诉我最新收盘价大于5块或者倒挂率大于50%的证券简称吗 724 | 我已了解到国航5月份的航班正常率是高于0.55的,那4月的正常率是多少呢 725 | 什么丛书是社会科学文献出版社在2011年1月份出版的 726 | 都有哪些重点城市销售套数年度周动均态大于1000或者销售套数较周均变化大于10的? 727 | 你好,你知道什么公司2012年的股票每股收益估计高于7毛八的吗 728 | 由北大出版社出版且售价大于50的书有哪些? 729 | 哪些南安市市级项目是在1996年12月里通过的? 730 | 你好,你知道今年第七个星期播放次数超过2个亿,还是在芒果平台上播的网剧和电视剧共有几部吗 731 | 所有注册时资金为1千万的企业中,哪些是山东的? 732 | 2017年京沪高铁的客运量达到1.8亿人次,那么净利润是多少 733 | 你把那些中国统计在2013年出版的年刊都告诉我 734 | 请问东莞在2011年日均成交量在1以上,那2012年的日均成交是多少? 735 | 溢价率小于0而且涨幅低于20%的股票股价多少 736 | 你跟我说说关注度低于7万的影片主演都有谁,都是什么电影 737 | 2018年7月份对商标代理违法行为进行检查,这次抽查任务的编号是多少啊 738 | 横店院线的一周票房是2856.8万,那么观影的有多少人 739 | 麻烦请告知中南建设地产公司2012年每股收益是多少谢谢,我只知道它2011年的每股收益是不超过1的。 740 | 你知道总共有多少个城市在上一周就成交了有1000套以上,成交量的同比增长还超10的吗? 741 | 啊,告诉我上周的A股房地产股当中股票价格超5.8100000000000005股的证券就行了,其他的股不需要 742 | 2018年11月行业前5家企业产能生产线大于10并且在产产能大于100万吨的产能占比平均是多少? 743 | 在上星期的A股房地产股有没有哪个股票的价格是高于5块8的呢 744 | 2008年12月由中国商业出版社的书的正题名是什么 745 | 2016A每股收益大于5角或者2016A市盈率低于50%的公司有哪些 746 | 建筑艺术学院在1401班开设的课程叫啥名来着? 747 | 有哪些机器人厂商在2016年销量占比超过5%而且2016年销量超过5000的? 748 | 你知道2017年市盈率就超过20,名叫鼎汉技术的这家公司它在2018年的市盈率预计会达到多大吗 749 | 请问东部地区外出农民工总量省内流动超过1000万人以上,跨省流动人口大概有多少? 750 | 2012年6月19日这一周成交面积大于4万平而且环比大于40的城市是哪个 751 | 哪些书是2010年12月出版的,还卖15元一本的呀? 752 | 我问你啊就是13年8月的时候百花洲文艺有出版什么书吗 753 | 在这份表的数据中,麻烦计算一线城市销售大于4000万平米或二线城市销售大于40000万平米的累计值同比增速最小是多少? 754 | 周换手率超过15或者收盘价高于2块的个票有吗 755 | 你知道单价高于10块或者频率大于12或者年价超过120的畅销期刊吗,告诉我都是什么期刊 756 | 哪些公司的持股比例大于20%或者投资金额大于8亿 757 | 我想问一下深圳有哪些楼盘在出售平均的价格高于10000元一平并且月环比的一个涨幅大于10%的? 758 | 我只想知道这部分股票的名称,就是最新的股票价值不超过14.6,市值呢又是超过44亿港币的 759 | 呵呵哒,高于17000亿的土地出让金啊,城市出让时间定了吗,是什么时候,平均溢价率知道了吗,是多少 760 | 机器人2016销量市占率超过2或者销量大于2000的是哪款机器人,叫啥 761 | 我上网看到徐州在12年2月份的时候成交量环比已经在10以上了,那3月呢? 762 | 哪些食品是宁夏中卫市中宁县舟塔乡宏成粮油商贸有限公司生产的 763 | 能给我说说那个每股收益就是11年的超过1的证券代码,或者那个月涨跌幅在10以上的证券代码吗 764 | 我了解发现中部地区房地产投资金额达到3000亿以上,那同比增长是多少? 765 | 我想咨询一下在2012二线都有哪些城市前一周成交是在1000以上而且环比也超过10的? 766 | 缮证日期为2011年11月29日并且使用权面积超过10000的土地使用权人总共有多少个? 767 | 诶,你知道17年度中国网络作家版税收入排名第1的唐家三少有哪些经典作吗 768 | 都有哪些货物在文锦渡那边存放的而且数量还超过22台的? 769 | 今年城市的住房成交同比数据有了吗,就是去年同期28天的日均环比不足100或者最近8天平均每天的环比数低于22的城市 770 | 我想知道上周五综艺收视率超过3%的,在湖南台播的都有几个啊 771 | 哪几款机器人在2016销售量可以超过4800而且占市场总销量可达90%以上的 772 | 需进行一致性评价企业数的批文数占比大于3%并且批文数等于1600有多少 773 | 想了解深圳南山土地出让的面积不足1,而且容积率还大于10的时候,是在哪一年成交的 774 | 我了解到包钢股份季度每股收益是小于10的,对应2018.10.31的收盘价,市盈率是多少? 775 | 考试科目是高等数学一并且人数大于5的年级专业有哪些? 776 | 上科技出版社在2004年5月份出版了什么书 777 | 在2017年全球物流自动化系统十五强中都有哪些公司是销售收入在100百万美元以上并且它的增长率高于10的? 778 | 我想问一下啊就是京沪高铁从16到17年平均每年客运量达到是多少人次啊 779 | 你好,我想咨询一下就是北京新影联影业那个公司在2018年底银幕数量达到500以上,你知道它单银幕票房收入是多少吗? 780 | 是在16年定增的传媒公司共有几家 781 | 房地产的什么指标在12年的时候它的绝对量高于100,而且同比增长不超过10%的? 782 | 麻烦帮我看看有哪些公司股价大于10并且总市值大于100或者年初以来市值大于30的? 783 | 那些滚动市盈率是不足10的股票,能不能告诉我他们的名字啊 784 | 需要全国统一招生的本科以上学历的岗位中,哪些招2个人? 785 | 累计票房超过1亿的电影上映了多久,口碑怎么样 786 | 就是上周的A股房地产股啊,告诉我一下股票名啊,我给忘了,但是我记得他们的股票的市值超过60亿或者最新的股价是小于11.6的 787 | 最低学历为本科以上就可以报的岗位中,招聘人数大于2名的有哪几个岗位? 788 | 哪些股的滚动市盈率是低于10的 789 | 平均票价超过10美元,或者票房超过10093百万美元的国家有几个 790 | 我想知道有哪几个企业的生产线是小于20条或者是总产能小于200万吨的 791 | 我想问一下就是啊18年EPS大于1的,并PE在10以上的都是哪些公司啊 792 | 麻烦帮我看一下市净率高于2的,或是重估净资产超过10的是什么证券,谢谢 793 | 请问有什么剧的播放数大于3亿的而且啊不是只在1个平台上播的? 794 | 了解到圆通总的市值已高于300亿,那它最后一笔交易的成交价是多少你清楚吗? 795 | 二手房上周成交量大于10或者年初至今累计成交大于600万平,那么当月累计成交量均值为多少 796 | 你好,请告诉我预计18年盈利增长率会在10以上的圆通它的市值是多少谢谢。 797 | 有几个地方的土地综合推介会其土地面积超过20552亩的,但是项目数低于20个的呀 798 | 我查询到预计12年每股盈余高于1元的招商地产,你知道它13年每股盈余又预计会是多少吗? 799 | 已经知道这个楼盘的土地出让金很高,远程17000亿,那么问题来了,它啥时候出让,平均溢价率又能达到多少 800 | 联创互联是16年定增的,那它增发目的是啥啊 801 | 总共有多少个土地使用权人的缮证日期为2011年11月29日并且使用权面积超过10000的? 802 | 请问网络综艺播放量里终级高手排在第5名,我想知道它播放量达到多少了? 803 | 你好啊,帮我算算有多少家公司是市值超100亿的,而且啊超过10元每股的呀 804 | 招聘人数为2人且学历最低需要全国统一招生本科的岗位是哪些? 805 | 面积大小超过1万的地域叫什么名称? 806 | 我想知道在18年6月国家社科基金项目都有什么,项目负责人有谁? 807 | 你能不能告诉我本期每吨1040元的河南冶金煤在上周的价格是多少 808 | 你知道实用警务英语着本书在哪里借阅,对外经济贸易大学出版社2014年8月出版的,岳洪锦主编。 809 | 学历最低需要本科且只招1个人的岗位的代码是什么? 810 | 哪几个项目总共投入的资金高于100万元,并且是在河北这个地方 811 | 唐镇运管区有什么数量为2台的设备?它们的设备型号分别是什么? 812 | 哪几个设备型号都有2台设备在唐镇运管区? 813 | 你好啊,我想问问啊那个哪些铁路公司20年的EPS估值小于1,或者PE估值小于10的呀,那这些公司股价多少啊 814 | 需要本科以上学历可以报的岗位中,哪些招聘人数大于3? 815 | 上一年同期成交低于800的城市我不考虑,能不能告诉我哪些 816 | 倒挂率高于1的公司共有几家 817 | 2017年6月5号哪个公司有生产45度浓香荞麦烧酒 818 | 啊,你刚说的这些城市是我要查的吗,就是11年一期房价超过1200一平而且二期超过1100的那个啊 819 | 你好,你能给我就是查一下吗,就是哪些楼盘在12年5月份的时候啊是超过3万一平的呀 820 | 我想问问你啊就是北京平均售价高于2万,还只是毛坯的有哪些楼盘啊 821 | 2017年开始建造的宝鸡市眉县首善镇三寨小学综合实验楼总的投资了多少钱 822 | 你知道那个商品房竣工低于10亿平的竣工率是多少,开发投资了有多少 823 | 想问问有没有哪个证券最新的市值显示在100亿以上而且它的股价还超过10块一股,可以告诉我证券的代码吗 824 | 在沈阳2005年批建的平台总共有多少个? 825 | 你好,你帮我看看目前18级经贸专业中有哪些班级是超过50人的呀 826 | 麻烦请告知银河地产它的持股数量达到100万股以上,同时它的最新市值在1百万以上还有市值比重也高于10的模拟组合谢谢。 827 | 2013年3月份出版的《寻味:行路天下,吃情不减》这本书的内容简介是什么 828 | 请问动态市盈率大于1的天神娱乐它前12个月的每股盈余你知道是多少吗? 829 | 我了解到12年1到5月这段时间房地产开发投资累计数已高于1000,那在这段时间的同比增速达到多少呢? 830 | 了解到分宗传媒收盘的价格在5元以上,本月的收益率是多少你知道吗? 831 | 我想问问就是17年1月1号出版的有几本书的定价是低于20的呀 832 | 请问近三年教育行业最新收盘价大于5块同时倒挂率还高于50%的证券都有哪些? 833 | 我查询到东莞在11年的日均成交量高于1,你知道它在2012年日均成交量是多少吗? 834 | 那个北京在5月份都有哪些楼盘是小于3万每平的,或者是月环比涨幅低于10的 835 | 可以帮我查询一下那些在4以上的国内钢企ROE吗,还有代码 836 | 深高速PE18E超过1了,那PE19E呢? 837 | 2010年每股盈余大于6角或者本益比大于50%的股票中,其中总市值最小的是多少 838 | 那个我想知道那些就是20年每股盈余预计会小于1,或者是市盈率预计小于10的公司的股价是多少,还有啊这些公司叫啥名啊 839 | 请问哪个部门有需要研究生硕士的岗位有1个录用名额? 840 | 那个龙湖地产市价盈利比率是多少啊,我就只了解到它在11年每股税后的利润是超过1块钱一股的 841 | 你好,那个举办项目少于20个,而且项目土地超过20552亩的推介会的地方一般有几个啊 842 | 哎呀,这次地产板块的换手股啊,还有成交额没有到9亿的,你帮我瞅瞅,哪些啊,那收盘价咋样,还能看么 843 | 是这样,请问2016A每股收益大于5角或者2016A市盈率低于50%的公司都有哪些啊 844 | 我想知道那个预计18年的市盈率会大于10,平均市净率也会高于1的有几家航空公司啊 845 | 房地产开发投资在12年1至5月累计数量超过1000,同比增速是多少呢? 846 | 诶你知道哪些岗要招3人以上吗,还都要求研究生及以上的呀 847 | 请问有没有哪个楼盘平均的价格低于4万一平的,还有就是他的容积率是多少呢 848 | 18级经贸专业中有哪几个班的人数是超过50人的 849 | 规划建筑面积大于160000万平方米或者成交楼面均价1平米小于1300的土地出让金啊是多少 850 | 查询到云南城投的PE12E是大于了1,那你知道它PE13E是多少吗? 851 | 最后的收盘价超过10元,涨跌幅也要超过20%的公司 852 | 帮我看看2012年每股收益大于1块或者本益比大于10%的股票股价,那个在这些股价中,最低可以低到多少 853 | 欸欸额08年1月那个青岛住宅期房成交有多少万平的呀,还有二月呢,也成交了有多大啊 854 | 12年5月北京有哪些楼盘还是毛坯,且平均售价还高于2万的呀 855 | 你知道什么公司会在16年定向增发新股,而且目的是配套融资的吗 856 | 2015年11月红旗出版社出版的书是什么 857 | 所有在2017年8月出版的书中,哪些是被中信出版社出版的? 858 | 请问2013年出版的书中,哪些是北大出版社出版? 859 | 你好,你知道15级有多少个班吗 860 | 有哪些城市在上周房子的成交数量超过1000套并且成交量同比增长高于1? 861 | 哪些股票的收盘价大于10块或者市值大于100亿 862 | 请问在2012年5月里深圳市有哪些楼盘是平均价高于10000块一平和月环比的涨幅在10%以上的? 863 | 有几档省级卫视晚间综艺收视率排名前10的综艺节目在1月18的时候市场的份额或者说是那个收视率的情况大于3%的 864 | 可以帮我查一下上海的楼盘情况吗,想了解12年5月容积率大于1,平均售价还高于2万每平的是哪些楼盘 865 | 有哪些公司15年定向增发新股是为了配套融资的呀 866 | 请问一下啊,哪本书在14年出版的 867 | 哪个城市一个月的成交量超1000同比增长超100 868 | 请问啊有没有什么一线城市日成交超过200还有他的环比也超过20的 869 | 哪些股票的总股本超过30亿股或者10A本益比大于20%和每股收益大于5毛 870 | 我想问一下就是在11年住宅成交金额已高于50,那工业的成交金额有多少你知道吗? 871 | 一共有多少个公司的评级为强烈推荐,还有市值超过100的? 872 | 有什么8万的项目在交通展区展出? 873 | 上市钢企钢材2017年生产成本大于100亿或者2017年产量超过50万吨的股票有几只 874 | 四川辞书在2016年1月份一共出版了几本书 875 | 从上映到现在累计票房超过2亿的都是哪些影片啊,每场平均有多少人次啊 876 | 诶你知道那些11年11月出版的书都是什么书吗,作者是谁吗 877 | 有几个国家的平均票价在10美元以上,或者是票房超10093百万美元呀 878 | 怎样的楼盘平均下来售价高于2万的呀,还有就是价格比较之后怎样 879 | 他们是如何对每股价格9.8的宁沪高速股票进行评级的 880 | 旅客吞吐量大于9000万或者飞机起降大于30万架次的机场有几个 881 | 成交楼面价格平均1平米低于1300或者建筑面积超过160000万平方米的楼盘需要多少出让金啊 882 | 请问有哪些书是北大出版社在13年出版的 883 | 2017年YAGEO的单季毛利率在第一季度是超过20%的,那18年第一季度的呢? 884 | 最新股价超过17块的模拟组合有多少 885 | 你知道18年股票收益比率估值大于20%或者每股收益大于5角的股票平均市净率吗 886 | 英飞凌有几个指标业务收入2018年大于13亿欧元或者2017年大于10亿欧元 887 | 为了买房,我需要知道一下成交同比数高过66是在哪个城市 888 | 请问有没有什么证券的2011的基本每股收益高于8毛,有的话是哪个证券代码 889 | 请告诉我房地产开发投资在5.12达到1000以上的时候,6月12号是多少? 890 | 请问有哪些城市它的房子可售数量超过1000并且可售环比在1以上的? 891 | 你好,你知道有多少家传媒公司是在15年增发,而且目的是配套融资的吗 892 | 什么书是中信出版社在13年出版的? 893 | 河南省智信染织的哪一种产品生产日期是2013年8月 894 | 有几个股12年的EPS大于1,PE也大于10的呀 895 | 出让时间是啥时候啊,噢就是那些建筑面积低于16000万平方米的项目 896 | 香港龙湖地产公司11年每股收益超过1元,想知道他市盈率会有多少? 897 | 想要了解一下楼盘均价在4万以下的楼盘以其容积率 898 | 那个12月29号市场份额大于4%的,收视率也高于5%的都是啥综艺啊 899 | 新盘的成交均价不足2w块一平,该怎么装修,去化情况怎么样了 900 | 我想问问你啊就是要招超过3人,并且学历要在硕士及以上的都是什么岗啊 901 | 请问奇台路兵团支行在线上的额度已高于100张,在线下分配的额度有多少呢 902 | 请问哪几本书的出版年份是16年呢? 903 | 你知道这本12年出版的往事是谁的著作吗 904 | 有哪几个城市的成交同比数是超过66的 905 | 诶,你知道北京12年5月的时候有哪些楼盘平均售价大于2万,还只是毛坯的呀 906 | 啊,关于这次股票的收盘价啊,大概情况怎么样,有没有股票的市盈率是不足41%的,有的话代码是多少 907 | 捐书超过2本的人中,哪位是在12年十月9号捐赠的呢? 908 | 这次建筑面积低于16000万平方米的项目,城市出让时间定在什么时候呀 909 | 有哪些省份资产负债率大于10%并且股息率大于1%的? 910 | 所有招5人的岗位中,哪些是需要最低学历为本科的? 911 | 深圳在11年平均每周成交数量不足10,你知道在12年平均下来深圳每周的成交情况吗? 912 | 我想查询一下上市的钢企在2017年的生产的成本和数量,只需要查询同年吨钢成本小于3500块的公司就可以了 913 | 社会科学文献出版社在2011年1月份出版了什么丛书 914 | 请问有哪些城市2010成交面积大于10并且2011年成交面积大于100的? 915 | 房地产开发投资在5月12号时已超过1000,那在下个月12号的时候是多少? 916 | 一共要花16800元钱的是12级什么专业? 917 | 投资308亿的扩建高速济青高速什么时候可以通车 918 | 所有招聘人数为1的岗位中,哪些是最低学历为本科就可以? 919 | 帮我查查职位数大于2并且学历学位是硕士研究生以上学历与学位的岗位部门有哪些? 920 | 09年1月出版的是哪本书啊,谁编著的呀 921 | 那个市值大于30亿美元,并且是台湾公司的都是哪些被动元器件制造公司啊 922 | 所有招1个人的岗位的部门中,哪些是需要研究生硕士? 923 | 11年12月在商务印书馆出版的是哪些书啊 924 | 哪种型号的享御是在2006年12月20号生产的 925 | 哪个鲍鱼养殖场的面积没有超过1万平方米? 926 | 请问2012年1月出版的书中哪些是由电子工业出版社出版的? 927 | 汇冠17年是为了什么而增发的呀 928 | 帮我查查有多少个平台是在沈阳2005年批建的? 929 | 二手房成交超过276135.60平或者成交超过了1000套的城市有哪些 930 | 哪个项目2002年1月份开工,2008年4月份建成投产的 931 | 请问有哪些项目的批准金额是3万而且研究的时间达到1年以上的,都有哪些单位呀? 932 | 已知环比数不足15,那么近两周的一个成交面积情况怎么样呢 933 | 有什么航空的公司国内客运量占比大于10%,还有市值大于100亿元的? 934 | 你知道有哪些书是在中信出版社18年出版的吗? 935 | 2013年的光纤陶瓷插针连接器研发项目是哪个公司的 936 | 麻烦跟我说一下中医医院要招啥专业的中医师啊? 937 | 你好,问一下17年本益比超过3倍,净资产收益率超过10%以及平均市净率超1倍的公司它们的股息率是多少 938 | 请问有没有哪个模拟组合持股量超过500的而且最新的股价是5块以上的 939 | 那些周涨幅没有达到15.25%的涨股和跌股 940 | 有哪些书是2013年8月百花洲文艺出版社出版的, 941 | 帮我看看有哪些项目做得周期是5年的,而且给的经费超过5000万元的 942 | 哪些招1人的岗位是需要最低本科就可以的? 943 | 平均市净率是多少的股票2011年每股收益大于5毛或者股票收益比率大于20% 944 | 请问一下你知道招聘人数超过1人并且学历是本科以上的部门有哪些吗? 945 | 你好,麻烦问一下部城市的成交大于2并且近7日成交大于20的7日成交同比最大有多少? 946 | 我想知道面积在5万平方公里以上的是哪个地区的什么沙漠呀 947 | 融创中国EPS2012E超过了1,那PES2013E呢,是多少? 948 | 你能不能告诉我9.81股的宁沪高速股票评级啊 949 | 上周五在湖南台播的,收视率还大于0.3%都有几个综艺啊 950 | 12年十月9号捐书超过2本的人有哪些? 951 | 职位数大于2并且学历学位是硕士研究生以上学历与学位的岗位部门有哪些? 952 | 请问哪部中国大陆的影片在18年上映? 953 | 你好,你知道15级金融与证券专业需要上的课程名吗 954 | 请问包钢股份季度每股收益低于10,那与18年10月31日的收盘价对应,你知道市盈率是多少吗? 955 | 我想了解一下15年进行定增的天神娱乐证券它增发是有几个目的的呀 956 | 呃你能就是帮我算算那个京沪高铁从16年开始到17年为止平均每年客运量有多大啊 957 | 实达集团在5月31日的收盘价超过了1,那市净率呢? 958 | 商品房去年同期成交超过20万平或者在上周成交超过28万平的城市有哪些 959 | 10A每股收益小于1块且本益比小于20%的股票股价是多少 960 | 哪些股的PB大于2,或者是RNAV大于10的 961 | 常宝股票价格大于10元,他有什么代码吗 962 | 帮我看看,都有哪些企业的场租合同金额超过10万而且展览规模超过10000平米的,都有哪些展会? 963 | 哪些公司的年涨跌幅是小于12%的 964 | 这些混合麦是在15年产的,一共有几吨 965 | 17年哪些股钢材产量超过300万吨的呀,或者是成本低于100亿的呀 966 | 你帮我查一下股价在12.5毛以上的公司叫啥名 967 | 2018年11月出版的车载激光测量数据智能后处理技术:SWDY深入解析与应用有多少页啊 968 | 我想了解13年北大出版社出版了哪些书 969 | 每股价格9.8的宁沪高速股票是怎么评级的 970 | 英飞凌业务收入2018年大于13亿欧元或者2017年大于10亿欧元的指标有几个 971 | 如果要买超1万的实木扶手椅,那要买多少张呀 972 | 我想知道新开普15年的增发价格 973 | 2017年成本费用达90亿元以上有哪些上市钢企,产量多少 974 | 国家对盐通高速的投资金额已超过200亿,那它线路长度大概是多少公里? 975 | 2018年9月30号开通的或者长度为197公里的的线路的行驶速度是多少? 976 | 有哪些证券15年定增,并且目的是配套融资的呀,那些证券代码是什么啊 977 | 哪些股的成交额小于9亿,顺便把对应的收盘价说一下 978 | 有没有10A每股收益大于5角并且10A本益比超过20%或者总股本超过30亿股的股票,都分别叫什么 979 | 你帮我算算12年第23周新房交易超1000套,或者是交易面积大于100000平方米的城市数量 980 | 公司参股高速公路持股比例大于20%或者2018H1投资收益大于1300万的是哪些高速 981 | 我查到融创中国EPS2012E已高于1,你知道它PES2013E是多少吗? 982 | 你知道有哪些企业的违法车辆数超过1辆并且违法情况为未处理的吗? 983 | 请问国家对盐通高速的投资金额是多于200亿的,你知道它的线路长度是多少吗? 984 | 请问全日制本科以上可以报且招2名人员以上的岗位是哪些? 985 | 请问一下18冬春航班数量大于10000并且航班占比大于10的净利润最小是多少? 986 | 我想问问啊就是哪些股12年的每股收益估值会在1以上,还有市盈率也会高于10的呀 987 | 总市值超过20亿元的股票叫啥呀,代码是什么呀 988 | 2004年5月上科技出版社出版的书是什么 989 | 你知道有哪些证券收盘价超过10元并且总市值达到100亿的吗? 990 | 那个京沪高铁16年和17年的平均客运量事多少啊 991 | 哪些地产公司低于1万每平的呀,那那售价同比又是多少啊 992 | 有没有符合年涨跌幅低于12%的公司啊 993 | 我已了解到兴森科技这个PCB公司在2016年的总收入高达20亿以上,麻烦请告知它的复合年均增长率是多少谢谢。 994 | 周涨幅低于80%或者累计涨幅低于2的股票有哪些 995 | 你好,咨询一下平均市净率大于2%或者重估净资产大于20的股票溢价率 996 | 有哪些城市上周的房子成交量是超过1000套或是同比增长大于10%的? 997 | 哪些股票的最新收盘价大于5块或者倒挂率大于50% 998 | 有多少家影投公司19年1月7号到13号这一周的票房超过10000000而且每场有超过10人次 999 | 你好,就是那些旅客吞吐量大于9000万或者飞机起降大于30万架次的机场有多少啊 1000 | 你帮我查一查准备资助超5万的公司名和项目名吧 1001 | 我想知道关于这次股市,滚动市盈率是低于10的股票,只需要告知他们的名字就行,其余信息暂时不需要 1002 | 你知道2012年保利地产公司的股票每股收益是多少吗,我只知道它在2011年的每股收益达到1块钱以上了 1003 | 请问GV影城投资公司这周的票房已高于2000万,你知道它观影人次是多少吗? 1004 | 那个青岛住宅期房在08年的时候啊一二月分别成交了多大的呀 1005 | 天津新盘有几个楼盘是满足容积率大于1,平均每套面积超过100平以及平均成交价超过8000块的 1006 | 2018Q1高于10的公司是哪个,他的2018Q2是多少 1007 | 请问南山它在哪一年的土地的出让面积小于1同时容积率在10以上? 1008 | 最近8天平均每天的环比数小于22或者去年同期28天的日均环比小于100的城市,同比为多少 1009 | 请问一下有哪些年级专业的考试科目是高等数学一并且人数大于5的? 1010 | 请问新房成交销售套数在5月20日至26日之间超过100并且销售套数环比低于10的城市有哪些? 1011 | 这次招聘中人数限制为3人一下,只要大专就可以报名的岗位有什么? 1012 | 我查询到东方航空东方航空PES2018E不足1,那现价呢? 1013 | 中国文联出版社在2016年3月出版了什么书 1014 | 那请问一下,北大出版社在14年的时候出版了哪些书? 1015 | 哪些证券的股价超过1块而且预计平均市净率是大于3%,这些证券代码是多少 1016 | 请问有哪些上市银行收盘价大于6块或流通市值有611.12亿元的? 1017 | 预计2018年每股收益大于0.5元或者本益比超过20%的股票平均市净率是多少 1018 | 有几部剧超过10集的啊? 1019 | 那个在台湾其代码是3026叫禾伸堂的它17年营收均是多少啊 1020 | 有没有哪个项目售价大于8100平,具体的位置在哪里 1021 | 我了解到各个地区房地产都有呈现下跌的情况,那我想知道在东部地区销售面积同比增长不足10的情况下,它的销售额同比增长是多少? 1022 | 那个12年每股盈余估值超过1的,市盈率也大于10的都是什么股票啊 1023 | 11年每股收益大于5毛或者11年本益比大于20%的股票最新价的最小值为多少 1024 | 哪些公司的股票2011年的每股收益不足1块而且本益比小于10% 1025 | 19年1月14号到20号期间票房有9065.87万元或者票房占比大于5%的院线有哪些? 1026 | 你帮我查一下这些11年每股税后利润达到1块以上,股价收益比率也大于10倍的公司它们的股票交易价是多少吧 1027 | 华科光电展位的面积大于10平方米,那他展位花了多少钱啊 1028 | 华师大出版社在2011年8月份出版了什么书 1029 | 麻烦咨询一下日成交环比大于10并且7日成交环比小于1的7日成交平均同比是多少? 1030 | 市值大于100亿或者收益大于5000万的股票2018年第三季度营收同比增速最大值为多少 1031 | 2018年9月份出版或者2018年12月份印刷了哪些书 1032 | 你好,那个12年5月份上海还是毛坯的,容积率也大于1的那些新盘的售价平均数是多少啊 1033 | 你知道2018年11月行业前5家企业产能生产线大于10并且在产产能大于100万吨的产能占比平均是多少吗? 1034 | 你给我简单讲一下在2013年3月份出版的《寻味:行路天下,吃情不减》的内容 1035 | 你帮我查一下00年后出版的书名吧 1036 | 你能告诉我东方航空17年每股收益是多少吗?已知他的股价是不超过1的。 1037 | 哪些股票的周换手率低于21%,多不多,收盘价达到多少 1038 | 请问一下18年哪些公司的每股盈余超过1,并且市盈率超过10的呀 1039 | 股票的投资评级与涨幅或者溢价率有关吗,若涨幅小于20%或者溢价率小于0,投资评级是什么样的 1040 | 想咨询一下福州市在2010年成交住宅土地宗数已多于10宗,可以跟我说一下成交的住宅建筑面积大概有多少吗? 1041 | 想要问一下2012年6月19日有没有哪个城市上周住宅用地楼面价超过400.1平而且成交面积超过400000平 1042 | 2018年湘雅二医院重点研究的项目有哪些呢,主要负责人有谁? 1043 | 查询一下共有多少城市本周销量大于1000套并且本周销量大于10万平米并且销量环比大于1的? 1044 | 哪本书是上科技在2004年5月份出版的 1045 | 哪个企业在2013年8月份生产了兰色印染布 1046 | 2017年每股盈余高于5毛的,或者市盈率高于10倍的那些公司它们的股票市净率是多少呀 1047 | 上周上海成交量是2770套,我想查一下在2011年它的周均成交量是多少 1048 | 你帮我算算那个那个开盘超过100套的,而且啊是在北京朝阳的,有几个楼盘啊 1049 | 哪些换手股的收盘价是超2块或者周换手率超过15的 1050 | 那些股票2016A每股收益不足4块的公司你知道吗,知道就快告诉我,急急急 1051 | 河南冶金煤的均价当期达到了1040元一吨,我想知道上周的价格是多少 1052 | 哪些项目的价格是比2千贵的? 1053 | 小于600的产能或者关停时间是2017年11月15日的产线有哪些 1054 | 你好啊我想问问幺幺年的时候啊,每股盈余大于8毛钱的股票一共有几只呢 1055 | 毕业实习(52)这门课程或者学分大于2分的课程都是怎么备注的 1056 | 诶你帮我查一下呗那本93年版本的浮士德多少钱来着 1057 | 矿床产矿品味不足35%的矿有哪几个啊 1058 | 我想知道地产板块的股票啊,收盘价大于7块或者成交量大于18000万手那旮沓的,多吗 1059 | 请问都有哪些指标绝对量是超过100并且同比增长在10%以上的呢? 1060 | 好像之前整存取半年的利率是3.3吧是不是,那从6月8号调整之后,利率是多少了 1061 | 我之前看到一个代码3026的,叫什么禾伸堂,是台湾的,我想问啊17年那个禾伸堂营收平均多少啊 1062 | 我想问一下啊就是北京是不是有那些3万以下每平,或者是月环比涨幅在10以下的楼盘,都是哪些楼盘啊 1063 | 方便告诉我在GV影城投资公司这周的票房达到2000万以上时,它观影人次达到了多少? 1064 | 请问春秋航空春秋航空18年冬春航班数量是多少呢,我只知道它的飞机数量在80架以上 1065 | 想了解都有哪些城市在上周成交量大于1总而且成交的面积是超过10万平方米的? 1066 | 批文数占比超过2%的批文数有多少例啊,还有就是有多少个药品 1067 | 我想问都有什么快递公司收入是低于200亿的,或净利润少于20亿的呀 1068 | 1069 | ((Apr)不等于3)时间是多少 1070 | 你知道有哪几个企业的生产线是小于20或总产能小于200的吗? 1071 | 麻烦查查违法车辆数超过1辆并且违法情况为未处理的企业有哪些? 1072 | 北京12年6月的可售环比在1以上,可售数量呢? 1073 | 那个12年5月啊上海哪些地方由楼盘就是套均面积大于100平,或者成交价平均下来超过10000的呀,都是叫啥名楼盘啊 1074 | 你好啊,我想知道17年定增的是哪些证券啊,倒挂率还大于50%的 1075 | 哪些证券17年为了项目融资进行定增的呀,代码多少啊 1076 | 本期河南冶金煤平均每吨是1040元,那么上个星期的价格是多少 1077 | 已经知道本周住房销售同比是小于110的,那么它的本周和上周的成交面积分别为多少 1078 | 所有自助金额为25万的机构中,哪些只有16名社工? 1079 | 12年出版的这本往事是谁写的呀 1080 | 请问这周有哪些电影院的票房达到100万以上而且观影多于1万人次? 1081 | 你好啊,哪些作者写的书在11年11月出版的呀,这些书叫啥名啊 1082 | 所有需要最低学历为本科的专业岗位中,哪些是只招1个人? 1083 | 哪些公司在2011年的时候的股票每股收益不足0.5或者本益比低于20的 1084 | 计划资助金额达到5万以上的是哪些企业资助的什么项目 1085 | 麻烦请告知在2016A锂电池需求量大于20的时候,那对三元电池的需求量又是多少? 1086 | 香港投资有限公司最新股价超过了1元,并且在本周涨幅排在前10,那你知道是涨了多少了吗? 1087 | 你帮我数数看目前有多少家公司2011年每股收益少于0.5元,本益比也少于20倍的呀 1088 | 如何对毕业实习(52)这门课程或者学分大于2分的课程进行备注 1089 | 诶你知道市值低于374亿,每股价格还低于26块的公司股票的评级结果吗 1090 | 2011年每股收益不足1块或者本益比不足10%的股票评级是什么 1091 | 3个月移动平均住宅去化月数不足11,可以销售的面积大概为多少啊 1092 | 你能告诉我哪些书是在2009年1月分出版的吗,还有责任者是谁呀 1093 | 我想知道股票的的总市值,目前我只知道这些股票的重估净资产超5或者每股净资产高于1.8 1094 | 哪款机器人在2016年的销量市占率大于2或者销量超过了2000,叫什么名字 1095 | 想要问问日成交超过2且成交环比超过20的城市是哪个 1096 | 你好,请告诉我新湖中宝这只股票在2012年的市盈率数值谢谢,我只查到2010年的市盈率,是已超过10 1097 | 你好,我想问你啊就是往事这本在12年出版的书,它的作者是哪位啊 1098 | 请问北京金泉港影城观影人次超过1万时,平局每场人次又达到多少? 1099 | 这周成交面积低于45200平米的城市有哪些呀 1100 | 计划总投资金额是超过1千万的项目是哪些? 1101 | 你好,我想查询一下收市价低于30的股票名字,还有它代码谢谢 1102 | 请问一下有哪些企业的场租合同金额超过10万而且展览规模超过10000平米的,还有展会都有哪些呢? 1103 | 我想知道周票房低于30000000元的影投公司的数量是多少? 1104 | 呃那个浙江台播的有几个能排在1月12号省级卫视晚间综艺节目收视率前10中啊,而且收视率还大于0.2%的呀 1105 | 11年11月出版的有哪些书啊,分别是谁编著的呀 1106 | 哪些高速在16年的股息率高于4%或者分红比大于40% 1107 | 2018年11月有哪些企业总产能大于100万吨并且产能占比大于10%的? 1108 | 请问申通业务量同比超过了10,那他的快递业务营收有多少? 1109 | 我想知道那些16年定增,并且增发目的是补充流动资金的证券代码是什么 1110 | 请问银河地产有哪些模拟组合持股数量超过100万股,还有它的最新市值在1百万元以上同时市值比重也高于的10? 1111 | 13年1月哈尔滨出版社出版了哪些书 1112 | 请问18年6月的时候立的国家社科基金项目有哪些,主要负责人有哪些 1113 | 你好请问像市值大于100亿或者收益大于5000万这样的股票,它的第三季度营收同比增速最大值是多少 1114 | 对于房地产开发投资这一款,5.12的时候已高于1000,那到下个月的12号大概会有多少? 1115 | 麻烦问一下2019年第7周有哪些剧在多个平台上播的同时播放数量还超3亿的 1116 | 在5月31日实达集团的收盘价是在1以上,我想知道它的市净率,麻烦说一下谢谢。 1117 | 请问湖中宝总股本高于50亿股时,每股的预收是多少 1118 | 股票价值是1369.38亿,或者周涨跌幅不超过3%的公司有哪些? 1119 | 有哪些公司的股票2016A每股收益小于4块钱呢 1120 | 2011年8月华东师范大学出版社出版的书是什么 1121 | 中部地区房地产投资金额超过3000亿,你知道同比增长了多少吗? 1122 | 我了解到盐通高速的投资金额已达到200亿以上,那建设的线路长度是多少? 1123 | 2011年,有没有每股收益不足1块而且本益比小于10%的股票,属于哪家公司 1124 | 有没有最新的股票的价格低于11块6的或者总市值超过60亿的股 1125 | 呃呃那个电影可支配收入大于3万美元的都是哪些国家啊,还有那个平均票价大于10美元的呢,这些国家票房分别达到多少了 1126 | 哪些学历最低要本科的学历的职位是只招1人的? 1127 | 都有哪些货物数量达到10个以上的并且在福田旅检作业存放点的? 1128 | 2013年8月生产的兰色印染布是什么公司的产品 1129 | 你知道2011年每股收益大于5毛或者股票收益比率大于20%的股票平均市净率吗 1130 | 分值低于10分或者评分标准是1、未纳入总体工作和年度工作计划的,扣2分。2、未建立领导机构或明确职责的,扣2分;3、未制定方案,扣2分;4、平安创建无部署、检查和总结的,扣2分的项目有几个 1131 | 一共有多少楼盘3月套数大于100并且3月均价大于10000的? 1132 | 有哪些项目营业的收入大于1亿美元,营收的同比增速大于20%并且占总营收的一个比例大于10%的? 1133 | 你好,我想查询一下上周和本周的一个住房销售面积,已经知道了连续这两周之内的变化比是在2以内 1134 | 那个问问啊就是目前有几家亚洲航空公司18年的PE估值大于10,而且啊PE估值也在超过1的呀 1135 | 针对在2018.10.31的股票收盘价,能不能把那些市盈率不足41%的股票名和代码列举一下 1136 | 钟表哪些参数检验收费超过400元的呀 1137 | 哪些设备的规格型号是JS-100型或者数量超过10的 1138 | 你好,你知道2011年每股收益超过1块,本益比也超过10倍的公司共有几家吗 1139 | 有哪些公司啊就是18年的EPS大于1,而且PE大于10的呀 1140 | 累计票房超过1亿的电影口碑指数是多少,上映天数多少天 1141 | 二手房当月累计成交量均值达到多少时它的上周成交量大于10或者年初至今累计成交大于600万平 1142 | 想要了解一下12年6月涨幅大于10而且超过4.4每股的是什么地产公司 1143 | 你好,我想知道什么书是哈尔滨出版社在13年1月出版的呀 1144 | 麻烦请告知交运行业在本周指数大于1000同时这一周的涨跌幅超过1的证券,谢谢。 1145 | 2006年12月20号生产的享御是什么型号的 1146 | 请问福州市在09年时成交的住宅建筑面积超过了100万平米,你知道平均每宗土地面积是多少吗? 1147 | 就是想查一下最新市值在100亿以上股价在10块钱以上的证券代码 1148 | 我发现深振业A的11EEPS不超过1,你知道11EPE是多少吗? 1149 | 我想问那个超过10元每股的那些公司市值多少,还有那个阳光的市值又是多少来着 1150 | 你帮我查一下属于东城区或者医院代码为1110008的医院名称有多少个 1151 | 求告知实用警务英语在哪可以找到,是岳洪锦主编的,出版社是对外经济贸易大学出版社,出版时间是社2014年8月 1152 | 想问一下青岛海尔通信数量所占比重达到多少时它销售的数量是在1000以上 1153 | 投资额大于22亿的高铁线路什么时候开通,从哪儿到哪 1154 | 你能帮我查查有几家航空公司的股价是不超过20元每股的吗? 1155 | 有哪些公司股价大于10并且总市值大于100或者年初以来市值大于30的? 1156 | 2017年6月5号生产的45度浓香荞麦烧酒是哪个公司的 1157 | 你知道什么公司打算资助项目超过5万的吗,还有这些分别是哪些项目你知道吗 1158 | 周涨幅不足15.25%的涨股和跌股名称分别是什么 1159 | 连续两周内的变化比低于2,那两周的成交面积分别为多少 1160 | 请问哪个股票代码的动态市盈率超过30倍,并且前12个月每股盈余超过5毛钱 1161 | 我了解到云南城投的PE12E是高于1的,想问问他PE13E是多少? 1162 | 你帮我查一下那些关注度大于7万都是什么影片,都是什么人演的呀 1163 | 你知道一共有多少个项目建设用地面积超过1万平米的吗 1164 | 上海上个星期成交了2770套房子,你知道2011年平均每周成交多少套吗 1165 | 总共有多少重点城市销售面积环比大于5并且销售面积较周均变化大于50的? 1166 | 请问人事部招的处长,这个岗位的职责是什么,我看到他们需要招1名。 1167 | 如何评级2011年每股收益低于1块或者本益比低于10%的股票 1168 | 市值比重小于30%的模拟组合有哪些,持股多少 1169 | 有几家传媒公司16年为了融资收购其他资产而进行定增的呀 1170 | 上一年度的同期的成交小于800套的城市有吗有的话是哪个呢 1171 | 那个上海5月卖出超2万一平的,还有月环比涨幅大于3的共有多少个楼盘啊 1172 | 19年第4周播放量高于5亿,并且在多个平台上都可以播出的有几部剧啊 1173 | 我想咨询一下就是北京大悦城IMAX店在这周票房达到50万以上,那你知道多少人观影吗? 1174 | 请问19年1月14日到20日期间票房高达9065.87万元的或者是票房占比超过5%的是什么院线? 1175 | 1176 | 书号为7200066109.0的书或者图说魔术入门这本书要多少 1177 | 新疆维吾尔自治区有哪些沙漠面积超过了2万平方公里的 1178 | 你好,哪些城市上周成交商品房不超过17万平的 1179 | 你好,你帮我查一查目前有几个项目其用地就达到1万平米以上的呀 1180 | 请问批准时间为98年的机构是哪几家? 1181 | 你知道公司参股高速公路持股比例大于20%或者2018H1投资收益大于1300万的路产名称吗 1182 | 我想知道出版日期为2018年9月或者印刷日期是2018年12月的书名,麻烦帮我查一下 1183 | 请问有什么产品需要1万以上才能买到? 1184 | 为什么增发最新收盘价小于10块而且倒挂率小于100%的股票 1185 | 人民出版社在2016年12月份出版了什么书 1186 | 有哪些产线是小于600的产能或者关停时间是2017年11月15日 1187 | 麻烦请问一下,销售面积环比大于5并且销售面积较周均变化大于50的重点城市总共有多少? 1188 | 请问哪个公司2018Q1大于10,还有他的2018Q2是多少呢 1189 | 你好,请告诉我在上周成交多于1宗同时成交面积达到10万平方米以上的城市谢谢。 1190 | 能不能查出尾盘价格为大于3元的并且超过10%跌幅的股票有哪些? 1191 | 诶,你知道20年的每股收益预计会低于1,市盈率也预计会小于10的都是什么公司吗,这些公司多少钱每股啊 1192 | 想知道每股收益超过5角并且市盈率超过20倍的是什么股票 1193 | 诶,你给我说说就是那个天神娱乐,在2015年定增的那个天神娱乐,有几个那个增发目的啊 1194 | 在2012年成交的住宅土地是2宗,你能不能告诉我它的成交住宅建筑面积是多少 1195 | 你知道那些17年市净率高于1倍,市盈率高于3倍,还有资产净收益率也高于10%的公司它们的股票股息率分别是多少吗 1196 | 2012年6月地产股有哪些证券最新市值是超过100亿并且最新股价也在10以上? 1197 | 打扰一下啊,17年出版的书叫什么名字 1198 | 总共有多少三线城市2011同期大于100并且2012至今大于10的? 1199 | 车载激光测量数据智能后处理技术:SWDY深入解析与应用这本书是在2018年11月份出版的,那么这本书的页数是多少啊 1200 | 上周和本周的成交面积大概在什么范围内使得环比数低于了2 1201 | 你好,请问可以通过周涨跌幅大于20%或者周换手率大于2%查询港股和总市值吗 1202 | 场均人次大于10或者平均票价大于30块的环比变化是多少 1203 | 一共有多少家公司的股票11年每股盈余高于1元,市盈率也高于10倍的呀 1204 | 有哪些书是在14年北大出版社出版的呀 1205 | 书号是9787111601548或者是9787111601722的书内容大要是什么 1206 | 河南省智信染织有限公司在2013年8月份生产了什么产品 1207 | 我知道6月1号那个京投银泰都达到了每股5元以上了,你不用再强调了,我只想问问京投银泰的股本总共多少? 1208 | 那些涨幅低于20%以及溢价率小于0的股票股价是多少啊 1209 | 那个能帮我查一查那个市值在500亿以上的,或者股本超过50亿股的都有哪些证券啊,哦还有PB大于2的证券也帮我查一下吧 1210 | 哪些股票的成交量大于18000万手或者收盘价大于7块 1211 | 诶,那个12年5月上海有几个楼盘售价是在2万以上每平的,而且啊月环比涨幅还达到3以上的呀 1212 | 你可以告诉我七号那一天收视率高于0.003的晚间综艺数量吗 1213 | 环比变化为多少时电影场均人次大于10或者平均票价大于30块 1214 | 1934年拍了什么电影,创作了什么歌曲啊 1215 | 请问大专学历以上就符合的岗位中,哪些只招1人? 1216 | 总共有多少家院线2018年底银幕数量大于500并且单银幕票房大于50万元的? 1217 | 你好,请问一下江中高速从2006年1月通车至今,其车流量的增长速度达到了多少 1218 | 你知道11年的每股收益大于5毛或者市盈率大于20%的股票的最低最新价为多少 1219 | 2019-1-14至1-20这一周密室逃生排名第4,我想知道在这一周它的票房是多少万? 1220 | 哪些产品的生产日期或批号为43191或者抽查是合格的 1221 | 招商地产预计12年的EPS超过1,那13年的EPS估值呢? 1222 | 你知道二手房上周成交量大于10或者年初至今累计成交大于600万平对应的当月累计成交量均值吗 1223 | 能不能帮我查询一下2016A的市值是多少,它的市盈率不足23,哦,对了对了,还有股价也要查 1224 | -------------------------------------------------------------------------------- /img/nl2sql_model_old.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/yscoder-github/nl2sql-tianchi/2d4463c5098d7533ebf879d874a8c14e61b8f269/img/nl2sql_model_old.png -------------------------------------------------------------------------------- /requirements: -------------------------------------------------------------------------------- 1 | absl-py==0.7.1 2 | astor==0.8.0 3 | Babel==2.7.0 4 | backports.csv==1.0.7 5 | certifi==2016.2.28 6 | cn2an==0.3.6 7 | cycler==0.10.0 8 | defusedxml==0.6.0 9 | docopt==0.6.2 10 | editdistance==0.5.3 11 | et-xmlfile==1.0.1 12 | gast==0.2.2 13 | google-pasta==0.1.7 14 | grpcio==1.22.0 15 | h5py==2.9.0 16 | jdcal==1.4.1 17 | jieba==0.39 18 | Keras==2.2.4 19 | Keras-Applications==1.0.8 20 | keras-bert==0.68.2 21 | keras-embed-sim==0.7.0 22 | keras-layer-normalization==0.12.0 23 | keras-multi-head==0.20.0 24 | keras-pos-embd==0.11.0 25 | keras-position-wise-feed-forward==0.6.0 26 | Keras-Preprocessing==1.1.0 27 | keras-self-attention==0.41.0 28 | keras-transformer==0.28.0 29 | kiwisolver==1.1.0 30 | Markdown==3.1.1 31 | matplotlib==3.1.1 32 | mock==3.0.5 33 | numpy==1.16.4 34 | odfpy==1.4.0 35 | openpyxl==2.4.11 36 | protobuf==3.9.0 37 | pyparsing==2.4.0 38 | python-dateutil==2.8.0 39 | pytz==2019.1 40 | PyYAML==5.1.1 41 | records==0.5.3 42 | scipy==1.3.0 43 | six==1.12.0 44 | SQLAlchemy==1.3.5 45 | tablib==0.13.0 46 | tensorboard==1.13.1 47 | tensorflow-estimator==1.13.0 48 | tensorflow-gpu==1.13.1 49 | termcolor==1.1.0 50 | tqdm==4.32.2 51 | Werkzeug==0.15.4 52 | wrapt==1.11.1 53 | xlrd==1.2.0 54 | xlwt==1.3.0 55 | -------------------------------------------------------------------------------- /run.sh: -------------------------------------------------------------------------------- 1 | #!/bin/bash 2 | export PATH=/root/anaconda3/bin:$PATH 3 | source ~/.bashrc 4 | source activate 5 | conda activate nl2sql-yscoder 6 | cd ./code 7 | PYTHONHASHSEED=0 python nl2sql_add_div_m_easy_csel.py --mode='test' --------------------------------------------------------------------------------