├── AdaBoost_Project1 └── AdaBoost.py ├── AdaBoost_Project2 ├── AdaBoost.py ├── horseColicTest2.txt └── horseColicTraining2.txt ├── AdaBoost_Project3 ├── AdaBoost.py ├── horseColicTest2.txt └── horseColicTraining2.txt ├── AdaBoost_Project4 ├── AdaBoost.py └── horseColicTraining2.txt ├── Apriori_Project1 ├── Apriori.py └── mushroom.dat ├── Bayes_Project1 └── Bayes.py ├── Bayes_Project2 ├── Bayes.py └── email │ ├── ham │ ├── 1.txt │ ├── 10.txt │ ├── 11.txt │ ├── 12.txt │ ├── 13.txt │ ├── 14.txt │ ├── 15.txt │ ├── 16.txt │ ├── 17.txt │ ├── 18.txt │ ├── 19.txt │ ├── 2.txt │ ├── 20.txt │ ├── 21.txt │ ├── 22.txt │ ├── 23.txt │ ├── 24.txt │ ├── 25.txt │ ├── 3.txt │ ├── 4.txt │ ├── 5.txt │ ├── 6.txt │ ├── 7.txt │ ├── 8.txt │ └── 9.txt │ └── spam │ ├── 1.txt │ ├── 10.txt │ ├── 11.txt │ ├── 12.txt │ ├── 13.txt │ ├── 14.txt │ ├── 15.txt │ ├── 16.txt │ ├── 17.txt │ ├── 18.txt │ ├── 19.txt │ ├── 2.txt │ ├── 20.txt │ ├── 21.txt │ ├── 22.txt │ ├── 23.txt │ ├── 24.txt │ ├── 25.txt │ ├── 3.txt │ ├── 4.txt │ ├── 5.txt │ ├── 6.txt │ ├── 7.txt │ ├── 8.txt │ └── 9.txt ├── Bayes_Project3 ├── Bayes.py ├── SogouC │ ├── ClassList.txt │ └── Sample │ │ ├── C000008 │ │ ├── 10.txt │ │ ├── 11.txt │ │ ├── 12.txt │ │ ├── 13.txt │ │ ├── 14.txt │ │ ├── 15.txt │ │ ├── 16.txt │ │ ├── 17.txt │ │ ├── 18.txt │ │ └── 19.txt │ │ ├── C000010 │ │ ├── 10.txt │ │ ├── 11.txt │ │ ├── 12.txt │ │ ├── 13.txt │ │ ├── 14.txt │ │ ├── 15.txt │ │ ├── 16.txt │ │ ├── 17.txt │ │ ├── 18.txt │ │ └── 19.txt │ │ ├── C000013 │ │ ├── 10.txt │ │ ├── 11.txt │ │ ├── 12.txt │ │ ├── 13.txt │ │ ├── 14.txt │ │ ├── 15.txt │ │ ├── 16.txt │ │ ├── 17.txt │ │ ├── 18.txt │ │ └── 19.txt │ │ ├── C000014 │ │ ├── 10.txt │ │ ├── 11.txt │ │ ├── 12.txt │ │ ├── 13.txt │ │ ├── 14.txt │ │ ├── 15.txt │ │ ├── 16.txt │ │ ├── 17.txt │ │ ├── 18.txt │ │ └── 19.txt │ │ ├── C000016 │ │ ├── 10.txt │ │ ├── 11.txt │ │ ├── 12.txt │ │ ├── 13.txt │ │ ├── 14.txt │ │ ├── 15.txt │ │ ├── 16.txt │ │ ├── 17.txt │ │ ├── 18.txt │ │ └── 19.txt │ │ ├── C000020 │ │ ├── 10.txt │ │ ├── 11.txt │ │ ├── 12.txt │ │ ├── 13.txt │ │ ├── 14.txt │ │ ├── 15.txt │ │ ├── 16.txt │ │ ├── 17.txt │ │ ├── 18.txt │ │ └── 19.txt │ │ ├── C000022 │ │ ├── 10.txt │ │ ├── 11.txt │ │ ├── 12.txt │ │ ├── 13.txt │ │ ├── 14.txt │ │ ├── 15.txt │ │ ├── 16.txt │ │ ├── 17.txt │ │ ├── 18.txt │ │ └── 19.txt │ │ ├── C000023 │ │ ├── 10.txt │ │ ├── 11.txt │ │ ├── 12.txt │ │ ├── 13.txt │ │ ├── 14.txt │ │ ├── 15.txt │ │ ├── 16.txt │ │ ├── 17.txt │ │ ├── 18.txt │ │ └── 19.txt │ │ └── C000024 │ │ ├── 10.txt │ │ ├── 11.txt │ │ ├── 12.txt │ │ ├── 13.txt │ │ ├── 14.txt │ │ ├── 15.txt │ │ ├── 16.txt │ │ ├── 17.txt │ │ ├── 18.txt │ │ └── 19.txt └── stopwords_cn.txt ├── BayesianAnalysisWithPython └── Gauss.py ├── CART_Project1 ├── CART.py ├── ex0.txt ├── ex00.txt └── ex2.txt ├── CART_Project2 ├── CART.py └── ex0.txt ├── CART_Project3 ├── CART.py ├── ex2.txt └── ex2test.txt ├── CART_Project4 ├── CART.py ├── Figure_1.png └── exp2.txt ├── CART_Project5 ├── CART.py ├── bikeSpeedVsIq_test.txt └── bikeSpeedVsIq_train.txt ├── CART_Project6 ├── CART.py ├── GUI.py ├── __pycache__ │ └── CART.cpython-36.pyc └── sine.txt ├── DecisionTree_Project1 ├── DecisionTree.py └── classifierStorage.txt ├── DecisionTree_Project2 ├── DecisionTree.py ├── lenses.txt └── tree.pdf ├── EM_Project1 └── EM_towcoins.py ├── FP_Growth_Project1 └── FP_Growth.py ├── FP_Growth_Project2 ├── FP_Growth.py ├── __pycache__ │ └── FP_Growth.cpython-36.pyc └── main.py ├── K_Means_Project1 ├── Figure_1.png ├── K_Means.py └── testSet.txt ├── K_Means_Project2 ├── Figure_1.png ├── K_Means.py └── testSet2.txt ├── K_Means_Project3 ├── Figure_1.png ├── KMeans.py ├── K_Means.py ├── Portland.png ├── __pycache__ │ └── KMeans.cpython-36.pyc ├── places.txt └── portlandClubs.txt ├── K_Means_Project4 ├── Figure_1.png └── K_Means.py ├── LinearRegression_Project1 ├── LinearRegression.py └── ex0.txt ├── LinearRegression_Project2 ├── LinearRegression.py └── ex0.txt ├── LinearRegression_Project3 ├── LinearRegression.py └── abalone.txt ├── LinearRegression_Project4 ├── LinearRegression.py └── lego │ ├── lego10030.html │ ├── lego10179.html │ ├── lego10181.html │ ├── lego10189.html │ ├── lego10196.html │ └── lego8288.html ├── Logistic_Project1 ├── Logistic.py └── testSet.txt ├── Logistic_Project2 ├── Logistic.py ├── horseColicTest.txt └── horseColicTraining.txt ├── Logistic_Project3 ├── Logistic.py ├── horseColicTest.txt └── horseColicTraining.txt ├── NeuralNetwork_Project1 ├── MLP.py ├── NN.py ├── mnist_dataset │ ├── mnist_readme.txt │ ├── mnist_test_10.csv │ └── mnist_train_100.csv └── my_own_images │ ├── 2828_my_own_2.png │ ├── 2828_my_own_3.png │ ├── 2828_my_own_4.png │ ├── 2828_my_own_5.png │ ├── 2828_my_own_6.png │ ├── 2828_my_own_image.png │ ├── 2828_my_own_noisy_6.png │ └── readme.txt ├── PCA_Project1 ├── PCA.py └── testSet.txt ├── PCA_Project2 ├── PCA.py └── secom.data ├── Perceptron_Project1 ├── DataSet.png ├── Perceptron.py ├── 决策区域图像.png └── 每次迭代错误分类数量.png ├── README.md ├── RidgeRegression_Project1 ├── RidgeRegression.py └── abalone.txt ├── RidgeRegression_Project2 ├── RidgeRegression.py └── abalone.txt ├── RidgeRegression_Project3 ├── RidgeRegression.py ├── cookbook_log.py └── lego │ ├── lego10030.html │ ├── lego10179.html │ ├── lego10181.html │ ├── lego10189.html │ ├── lego10196.html │ └── lego8288.html ├── SVD_Project1 └── SVD.py ├── SVD_Project2 ├── 0_5.txt └── SVD.py ├── SVM_Project1 ├── Figure_1.png ├── SVM.py └── testSet.txt ├── SVM_Project2 ├── Figure_2.png ├── SVM.py └── testSet.txt ├── SVM_Project3 ├── SVM.py ├── testSetRBF.txt └── testSetRBF2.txt ├── SVM_Project4.zip ├── SVM_Project5.zip ├── kNN_Project1 ├── Chap_1.py ├── datingTestSet.txt ├── datingTestSet2.txt └── kNN.py └── kNN_Project2.zip /AdaBoost_Project3/AdaBoost.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Thu Jul 26 22:25:48 2018 4 | 5 | @author: wzy 6 | """ 7 | import numpy as np 8 | from sklearn.ensemble import AdaBoostClassifier 9 | from sklearn.tree import DecisionTreeClassifier 10 | 11 | """ 12 | 函数说明:加载文件 13 | 14 | Parameters: 15 | fileName - 文件名 16 | 17 | Returns: 18 | dataMat - 数据矩阵 19 | labelMat - 数据标签 20 | 21 | Modify: 22 | 2018-07-26 23 | """ 24 | def loadDataSet(fileName): 25 | # 特征个数 26 | numFeat = len((open(fileName).readline().split('\t'))) 27 | dataMat = [] 28 | labelMat = [] 29 | fr = open(fileName) 30 | for line in fr.readlines(): 31 | lineArr = [] 32 | curLine = line.strip().split('\t') 33 | for i in range(numFeat - 1): 34 | lineArr.append(float(curLine[i])) 35 | dataMat.append(lineArr) 36 | labelMat.append(float(curLine[-1])) 37 | return dataMat, labelMat 38 | 39 | 40 | if __name__ == '__main__': 41 | dataArr, classLabels = loadDataSet('horseColicTraining2.txt') 42 | testArr, testLabelArr = loadDataSet('horseColicTest2.txt') 43 | bdt = AdaBoostClassifier(DecisionTreeClassifier(max_depth=2), algorithm="SAMME", n_estimators=10) 44 | bdt.fit(dataArr, classLabels) 45 | predictions = bdt.predict(dataArr) 46 | errArr = np.mat(np.zeros((len(dataArr), 1))) 47 | for i in range(len(classLabels)): 48 | if classLabels[i] != predictions[i]: 49 | errArr[i] = 1 50 | print('训练集的错误率:%.3f%%' % float(errArr.sum() / len(dataArr) * 100)) 51 | predictions = bdt.predict(testArr) 52 | errArr = np.mat(np.zeros((len(testArr), 1))) 53 | for i in range(len(testLabelArr)): 54 | if testLabelArr[i] != predictions[i]: 55 | errArr[i] = 1 56 | print('测试集的错误率:%.3f%%' % float(errArr.sum() / len(testArr) * 100)) 57 | -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/1.txt: -------------------------------------------------------------------------------- 1 | Hi Peter, 2 | 3 | With Jose out of town, do you want to 4 | meet once in a while to keep things 5 | going and do some interesting stuff? 6 | 7 | Let me know 8 | Eugene -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/10.txt: -------------------------------------------------------------------------------- 1 | Ryan Whybrew commented on your status. 2 | 3 | Ryan wrote: 4 | "turd ferguson or butt horn." 5 | -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/11.txt: -------------------------------------------------------------------------------- 1 | Arvind Thirumalai commented on your status. 2 | 3 | Arvind wrote: 4 | ""you know"" 5 | 6 | 7 | Reply to this email to comment on this status. 8 | 9 | -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/12.txt: -------------------------------------------------------------------------------- 1 | Thanks Peter. 2 | 3 | I'll definitely check in on this. How is your book 4 | going? I heard chapter 1 came in and it was in 5 | good shape. ;-) 6 | 7 | I hope you are doing well. 8 | 9 | Cheers, 10 | 11 | Troy -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/13.txt: -------------------------------------------------------------------------------- 1 | Jay Stepp commented on your status. 2 | 3 | Jay wrote: 4 | ""to the" ???" 5 | 6 | 7 | Reply to this email to comment on this status. 8 | 9 | To see the comment thread, follow the link below: 10 | 11 | -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/14.txt: -------------------------------------------------------------------------------- 1 | LinkedIn 2 | 3 | Kerry Haloney requested to add you as a connection on LinkedIn: 4 | 5 | Peter, 6 | 7 | I'd like to add you to my professional network on LinkedIn. 8 | 9 | - Kerry Haloney 10 | 11 | -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/15.txt: -------------------------------------------------------------------------------- 1 | Hi Peter, 2 | 3 | The hotels are the ones that rent out the tent. They are all lined up on the hotel grounds : )) So much for being one with nature, more like being one with a couple dozen tour groups and nature. 4 | I have about 100M of pictures from that trip. I can go through them and get you jpgs of my favorite scenic pictures. 5 | 6 | Where are you and Jocelyn now? New York? Will you come to Tokyo for Chinese New Year? Perhaps to see the two of you then. I will go to Thailand for winter holiday to see my mom : ) 7 | 8 | Take care, 9 | D 10 | -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/16.txt: -------------------------------------------------------------------------------- 1 | yeah I am ready. I may not be here because Jar Jar has plane tickets to Germany for me. -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/17.txt: -------------------------------------------------------------------------------- 1 | Benoit Mandelbrot 1924-2010 2 | 3 | Benoit Mandelbrot 1924-2010 4 | 5 | Wilmott Team 6 | 7 | Benoit Mandelbrot, the mathematician, the father of fractal mathematics, and advocate of more sophisticated modelling in quantitative finance, died on 14th October 2010 aged 85. 8 | 9 | Wilmott magazine has often featured Mandelbrot, his ideas, and the work of others inspired by his fundamental insights. 10 | 11 | You must be logged on to view these articles from past issues of Wilmott Magazine. -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/18.txt: -------------------------------------------------------------------------------- 1 | Hi Peter, 2 | 3 | Sure thing. Sounds good. Let me know what time would be good for you. 4 | I will come prepared with some ideas and we can go from there. 5 | 6 | Regards, 7 | 8 | -Vivek. -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/19.txt: -------------------------------------------------------------------------------- 1 | LinkedIn 2 | 3 | Julius O requested to add you as a connection on LinkedIn: 4 | 5 | Hi Peter. 6 | 7 | Looking forward to the book! 8 | 9 | 10 | Accept View invitation from Julius O 11 | -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/2.txt: -------------------------------------------------------------------------------- 1 | Yay to you both doing fine! 2 | 3 | I'm working on an MBA in Design Strategy at CCA (top art school.) It's a new program focusing on more of a right-brained creative and strategic approach to management. I'm an 1/8 of the way done today! -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/20.txt: -------------------------------------------------------------------------------- 1 | I've thought about this and think it's possible. We should get another 2 | lunch. I have a car now and could come pick you up this time. Does 3 | this wednesday work? 11:50? 4 | 5 | Can I have a signed copy of you book? -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/21.txt: -------------------------------------------------------------------------------- 1 | we saw this on the way to the coast...thought u might like it 2 | 3 | hangzhou is huge, one day wasn't enough, but we got a glimpse... 4 | 5 | we went inside the china pavilion at expo, it is pretty interesting, 6 | each province has an exhibit... -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/22.txt: -------------------------------------------------------------------------------- 1 | Hi Hommies, 2 | 3 | Just got a phone call from the roofer, they will come and spaying the foaming today. it will be dusty. pls close all the doors and windows. 4 | Could you help me to close my bathroom window, cat window and the sliding door behind the TV? 5 | I don't know how can those 2 cats survive...... 6 | 7 | Sorry for any inconvenience! -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/23.txt: -------------------------------------------------------------------------------- 1 | 2 | SciFinance now automatically generates GPU-enabled pricing & risk model source code that runs up to 50-300x faster than serial code using a new NVIDIA Fermi-class Tesla 20-Series GPU. 3 | 4 | SciFinance?is a derivatives pricing and risk model development tool that automatically generates C/C++ and GPU-enabled source code from concise, high-level model specifications. No parallel computing or CUDA programming expertise is required. 5 | 6 | SciFinance's automatic, GPU-enabled Monte Carlo pricing model source code generation capabilities have been significantly extended in the latest release. This includes: -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/24.txt: -------------------------------------------------------------------------------- 1 | Ok I will be there by 10:00 at the latest. -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/25.txt: -------------------------------------------------------------------------------- 1 | That is cold. Is there going to be a retirement party? 2 | Are the leaves changing color? -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/3.txt: -------------------------------------------------------------------------------- 1 | WHat is going on there? 2 | I talked to John on email. We talked about some computer stuff that's it. 3 | 4 | I went bike riding in the rain, it was not that cold. 5 | 6 | We went to the museum in SF yesterday it was $3 to get in and they had 7 | free food. At the same time was a SF Giants game, when we got done we 8 | had to take the train with all the Giants fans, they are 1/2 drunk. -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/4.txt: -------------------------------------------------------------------------------- 1 | Yo. I've been working on my running website. I'm using jquery and the jqplot plugin. I'm not too far away from having a prototype to launch. 2 | 3 | You used jqplot right? If not, I think you would like it. -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/5.txt: -------------------------------------------------------------------------------- 1 | There was a guy at the gas station who told me that if I knew Mandarin 2 | and Python I could get a job with the FBI. -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/6.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/Bayes_Project2/email/ham/6.txt -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/7.txt: -------------------------------------------------------------------------------- 1 | Zach Hamm commented on your status. 2 | 3 | Zach wrote: 4 | "doggy style - enough said, thank you & good night" 5 | 6 | 7 | -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/8.txt: -------------------------------------------------------------------------------- 1 | This e-mail was sent from a notification-only address that cannot accept incoming e-mail. Please do not reply to this message. 2 | 3 | Thank you for your online reservation. The store you selected has located the item you requested and has placed it on hold in your name. Please note that all items are held for 1 day. Please note store prices may differ from those online. 4 | 5 | If you have questions or need assistance with your reservation, please contact the store at the phone number listed below. You can also access store information, such as store hours and location, on the web at http://www.borders.com/online/store/StoreDetailView_98. -------------------------------------------------------------------------------- /Bayes_Project2/email/ham/9.txt: -------------------------------------------------------------------------------- 1 | Hi Peter, 2 | 3 | These are the only good scenic ones and it's too bad there was a girl's back in one of them. Just try to enjoy the blue sky : )) 4 | 5 | D -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/1.txt: -------------------------------------------------------------------------------- 1 | --- Codeine 15mg -- 30 for $203.70 -- VISA Only!!! -- 2 | 3 | -- Codeine (Methylmorphine) is a narcotic (opioid) pain reliever 4 | -- We have 15mg & 30mg pills -- 30/15mg for $203.70 - 60/15mg for $385.80 - 90/15mg for $562.50 -- VISA Only!!! --- -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/10.txt: -------------------------------------------------------------------------------- 1 | OrderCializViagra Online & Save 75-90% 2 | 3 | 0nline Pharmacy NoPrescription required 4 | Buy Canadian Drugs at Wholesale Prices and Save 75-90% 5 | FDA-Approved drugs + Superb Quality Drugs only! 6 | Accept all major credit cards -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/11.txt: -------------------------------------------------------------------------------- 1 | You Have Everything To Gain! 2 | 3 | Incredib1e gains in length of 3-4 inches to yourPenis, PERMANANTLY 4 | 5 | Amazing increase in thickness of yourPenis, up to 30% 6 | BetterEjacu1ation control 7 | Experience Rock-HardErecetions 8 | Explosive, intenseOrgasns 9 | Increase volume ofEjacu1ate 10 | Doctor designed and endorsed 11 | 100% herbal, 100% Natural, 100% Safe 12 | The proven NaturalPenisEnhancement that works! 13 | 100% MoneyBack Guaranteeed -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/12.txt: -------------------------------------------------------------------------------- 1 | Buy Ambiem (Zolpidem) 5mg/10mg @ $2.39/- pill 2 | 3 | 30 pills x 5 mg - $129.00 4 | 60 pills x 5 mg - $199.20 5 | 180 pills x 5 mg - $430.20 6 | 30 pills x 10 mg - $ 138.00 7 | 120 pills x 10 mg - $ 322.80 -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/13.txt: -------------------------------------------------------------------------------- 1 | OrderCializViagra Online & Save 75-90% 2 | 3 | 0nline Pharmacy NoPrescription required 4 | Buy Canadian Drugs at Wholesale Prices and Save 75-90% 5 | FDA-Approved drugs + Superb Quality Drugs only! 6 | Accept all major credit cards 7 | Order Today! From $1.38 8 | -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/14.txt: -------------------------------------------------------------------------------- 1 | BuyVIAGRA 25mg, 50mg, 100mg, 2 | BrandViagra, FemaleViagra from $1.15 per pill 3 | 4 | 5 | ViagraNoPrescription needed - from Certified Canadian Pharmacy 6 | 7 | Buy Here... We accept VISA, AMEX, E-Check... Worldwide Delivery -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/15.txt: -------------------------------------------------------------------------------- 1 | You Have Everything To Gain! 2 | 3 | Incredib1e gains in length of 3-4 inches to yourPenis, PERMANANTLY 4 | 5 | Amazing increase in thickness of yourPenis, up to 30% 6 | BetterEjacu1ation control 7 | Experience Rock-HardErecetions 8 | Explosive, intenseOrgasns 9 | Increase volume ofEjacu1ate 10 | Doctor designed and endorsed 11 | 100% herbal, 100% Natural, 100% Safe -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/16.txt: -------------------------------------------------------------------------------- 1 | You Have Everything To Gain! 2 | 3 | Incredib1e gains in length of 3-4 inches to yourPenis, PERMANANTLY 4 | 5 | Amazing increase in thickness of yourPenis, up to 30% 6 | BetterEjacu1ation control 7 | Experience Rock-HardErecetions 8 | Explosive, intenseOrgasns 9 | Increase volume ofEjacu1ate 10 | Doctor designed and endorsed 11 | 100% herbal, 100% Natural, 100% Safe -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/17.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/Bayes_Project2/email/spam/17.txt -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/18.txt: -------------------------------------------------------------------------------- 1 | Codeine (the most competitive price on NET!) 2 | 3 | Codeine (WILSON) 30mg x 30 $156.00 4 | Codeine (WILSON) 30mg x 60 $291.00 (+4 FreeViagra pills) 5 | Codeine (WILSON) 30mg x 90 $396.00 (+4 FreeViagra pills) 6 | Codeine (WILSON) 30mg x 120 $492.00 (+10 FreeViagra pills) -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/19.txt: -------------------------------------------------------------------------------- 1 | Get Up to 75% OFF at Online WatchesStore 2 | 3 | Discount Watches for All Famous Brands 4 | 5 | * Watches: aRolexBvlgari, Dior, Hermes, Oris, Cartier, AP and more brands 6 | * Louis Vuitton Bags & Wallets 7 | * Gucci Bags 8 | * Tiffany & Co Jewerly 9 | 10 | Enjoy a full 1 year WARRANTY 11 | Shipment via reputable courier: FEDEX, UPS, DHL and EMS Speedpost 12 | You will 100% recieve your order 13 | Save Up to 75% OFF Quality Watches -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/2.txt: -------------------------------------------------------------------------------- 1 | Hydrocodone/Vicodin ES/Brand Watson 2 | 3 | Vicodin ES - 7.5/750 mg: 30 - $195 / 120 $570 4 | Brand Watson - 7.5/750 mg: 30 - $195 / 120 $570 5 | Brand Watson - 10/325 mg: 30 - $199 / 120 - $588 6 | NoPrescription Required 7 | FREE Express FedEx (3-5 days Delivery) for over $200 order 8 | Major Credit Cards + E-CHECK -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/20.txt: -------------------------------------------------------------------------------- 1 | Get Up to 75% OFF at Online WatchesStore 2 | 3 | Discount Watches for All Famous Brands 4 | 5 | * Watches: aRolexBvlgari, Dior, Hermes, Oris, Cartier, AP and more brands 6 | * Louis Vuitton Bags & Wallets 7 | * Gucci Bags 8 | * Tiffany & Co Jewerly 9 | 10 | Enjoy a full 1 year WARRANTY 11 | Shipment via reputable courier: FEDEX, UPS, DHL and EMS Speedpost 12 | You will 100% recieve your order -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/21.txt: -------------------------------------------------------------------------------- 1 | Percocet 10/625 mg withoutPrescription 30 tabs - $225! 2 | Percocet, a narcotic analgesic, is used to treat moderate to moderately SeverePain 3 | Top Quality, EXPRESS Shipping, 100% Safe & Discreet & Private. 4 | Buy Cheap Percocet Online -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/22.txt: -------------------------------------------------------------------------------- 1 | Get Up to 75% OFF at Online WatchesStore 2 | 3 | Discount Watches for All Famous Brands 4 | 5 | * Watches: aRolexBvlgari, Dior, Hermes, Oris, Cartier, AP and more brands 6 | * Louis Vuitton Bags & Wallets 7 | * Gucci Bags 8 | * Tiffany & Co Jewerly 9 | 10 | Enjoy a full 1 year WARRANTY 11 | Shipment via reputable courier: FEDEX, UPS, DHL and EMS Speedpost 12 | You will 100% recieve your order -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/23.txt: -------------------------------------------------------------------------------- 1 | You Have Everything To Gain! 2 | 3 | Incredib1e gains in length of 3-4 inches to yourPenis, PERMANANTLY 4 | 5 | Amazing increase in thickness of yourPenis, up to 30% 6 | BetterEjacu1ation control 7 | Experience Rock-HardErecetions 8 | Explosive, intenseOrgasns 9 | Increase volume ofEjacu1ate 10 | Doctor designed and endorsed 11 | 100% herbal, 100% Natural, 100% Safe -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/24.txt: -------------------------------------------------------------------------------- 1 | You Have Everything To Gain! 2 | 3 | Incredib1e gains in length of 3-4 inches to yourPenis, PERMANANTLY 4 | 5 | Amazing increase in thickness of yourPenis, up to 30% 6 | BetterEjacu1ation control 7 | Experience Rock-HardErecetions 8 | Explosive, intenseOrgasns 9 | Increase volume ofEjacu1ate 10 | Doctor designed and endorsed 11 | 100% herbal, 100% Natural, 100% Safe -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/25.txt: -------------------------------------------------------------------------------- 1 | Experience with BiggerPenis Today! Grow 3-inches more 2 | 3 | The Safest & Most Effective Methods Of_PenisEn1argement. 4 | Save your time and money! 5 | BetterErections with effective Ma1eEnhancement products. 6 | 7 | #1 Ma1eEnhancement Supplement. Trusted by Millions. Buy Today! -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/3.txt: -------------------------------------------------------------------------------- 1 | You Have Everything To Gain! 2 | 3 | Incredib1e gains in length of 3-4 inches to yourPenis, PERMANANTLY 4 | 5 | Amazing increase in thickness of yourPenis, up to 30% 6 | BetterEjacu1ation control 7 | Experience Rock-HardErecetions 8 | Explosive, intenseOrgasns 9 | Increase volume ofEjacu1ate 10 | Doctor designed and endorsed 11 | 100% herbal, 100% Natural, 100% Safe 12 | The proven NaturalPenisEnhancement that works! 13 | 100% MoneyBack Guaranteeed -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/4.txt: -------------------------------------------------------------------------------- 1 | Percocet 10/625 mg withoutPrescription 30 tabs - $225! 2 | Percocet, a narcotic analgesic, is used to treat moderate to moderately SeverePain 3 | Top Quality, EXPRESS Shipping, 100% Safe & Discreet & Private. 4 | Buy Cheap Percocet Online -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/5.txt: -------------------------------------------------------------------------------- 1 | --- Codeine 15mg -- 30 for $203.70 -- VISA Only!!! -- 2 | 3 | -- Codeine (Methylmorphine) is a narcotic (opioid) pain reliever 4 | -- We have 15mg & 30mg pills -- 30/15mg for $203.70 - 60/15mg for $385.80 - 90/15mg for $562.50 -- VISA Only!!! --- -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/6.txt: -------------------------------------------------------------------------------- 1 | OEM Adobe & Microsoft softwares 2 | Fast order and download 3 | 4 | Microsoft Office Professional Plus 2007/2010 $129 5 | Microsoft Windows 7 Ultimate $119 6 | Adobe Photoshop CS5 Extended 7 | Adobe Acrobat 9 Pro Extended 8 | Windows XP Professional & thousand more titles -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/7.txt: -------------------------------------------------------------------------------- 1 | Bargains Here! Buy Phentermin 37.5 mg (K-25) 2 | 3 | Buy Genuine Phentermin at Low Cost 4 | VISA Accepted 5 | 30 - $130.50 6 | 60 - $219.00 7 | 90 - $292.50 8 | 120 - $366.00 9 | 180 - $513.00 -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/8.txt: -------------------------------------------------------------------------------- 1 | You Have Everything To Gain! 2 | 3 | Incredib1e gains in length of 3-4 inches to yourPenis, PERMANANTLY 4 | 5 | Amazing increase in thickness of yourPenis, up to 30% 6 | BetterEjacu1ation control 7 | Experience Rock-HardErecetions 8 | Explosive, intenseOrgasns 9 | Increase volume ofEjacu1ate 10 | Doctor designed and endorsed 11 | 100% herbal, 100% Natural, 100% Safe -------------------------------------------------------------------------------- /Bayes_Project2/email/spam/9.txt: -------------------------------------------------------------------------------- 1 | Bargains Here! Buy Phentermin 37.5 mg (K-25) 2 | 3 | Buy Genuine Phentermin at Low Cost 4 | VISA Accepted 5 | 30 - $130.50 6 | 60 - $219.00 7 | 90 - $292.50 8 | 120 - $366.00 9 | 180 - $513.00 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/ClassList.txt: -------------------------------------------------------------------------------- 1 | C000008 财经 2 | C000010 IT 3 | C000013 健康 4 | C000014 体育 5 | C000016 旅游 6 | C000020 教育 7 | C000022 招聘 8 | C000023 文化 9 | C000024 军事 10 | -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000008/10.txt: -------------------------------------------------------------------------------- 1 |   本报记者陈雪频实习记者唐翔发自上海 2 |   一家刚刚成立两年的网络支付公司,它的目标是成为市值100亿美元的上市公司。 3 |   这家公司叫做快钱,说这句话的是快钱的CEO关国光。他之前曾任网易的高级副总裁,负责过网易的上市工作。对于为什么选择第三方支付作为创业方向,他曾经对媒体这样说:“我能看到这个胡同对面是什么,别人只能看到这个胡同。”自信与狂妄只有一步之遥——这几乎是所有创业者的共同特征,是自信还是狂妄也许需要留待时间来考证。 4 |   对于市值100亿美元的上市公司,他是这样算这笔账的,“百度上市时广告客户数量只有4万,而且它所做的只是把客户吸引过来,就可以支撑起现有的庞大市值;而我们几年后的客户数量是几千万,而且这些客户都是能直接带来利润的,说市值100亿美元一点都不夸张。” 5 |   这家公司2005年年底注册用户达到400万,计划今年注册用户突破1000万,号称是国内最大的第三方网络支付平台。“在美国跟支付相关的收入已经超过了所有商业银行本身利差收入的总和,我所查到的数据是3000亿美元,其中超过70%是个人消费者带来的收入。”关国光喜欢借用美国支付产业的现状与中国的情况进行比较。虽然美国和中国差异显著,但他坚信中国的第三方支付市场前景非常广阔。 6 |   便利和安全挑战网络支付 7 |   “你只需要一个手机号码或者一个邮件地址就可以网络支付。”在快钱的户外广告中这样写道,这和传统的需要银行账户才能进行网络支付的习惯形成了鲜明的对比。 8 |   然而这种支付模式和传统的网络支付并无本质的区别,因为每一个手机号码和邮件地址背后都会对应着一个账户——这个账户可以是信用卡账户、借记卡账户,也包括邮局汇款、手机代收、电话代收、预付费卡和点卡等多种形式。 9 |   “快钱的功能其实就相当于融合了很多交易工具的VISA卡,所以又被称为网络VISA。”关国光说,“从本质上讲,我们和VISA等采用的底层技术是没有差别的,我们和它的区别在于VISA卡面对的交易工具比较单一,而快钱面对的是多种分散的交易工具。” 10 |   因为“信用缺位”,网络支付一直是困扰中国电子商务发展的瓶颈之一。网络支付平台相当于“信用缺位”条件下的“补位产物”,它把众多的银行卡整合到一个页面端口,以支付公司作为信用中介,在买家确认收到商品前,代替买卖双方暂时保管货款。 11 |   目前最知名的网络支付平台包括阿里巴巴的支付宝和eBay的Paypal(贝宝)。关国光表示,快钱最大的特点是第三方的支付平台,主要客户为那些中小公司。这些网络支付平台的主要业务是针对母公司的,不太可能被其母公司同行使用。 12 |   “而用户可以选择使用从银行卡、邮政汇款到点卡、预付费卡的各种支付方式,快钱平台对人口和支付工具的覆盖都非常广泛,这是我们创新的地方。”关国光告诉《第一财经日报》。 13 |   交易的安全性是网上支付平台最大的问题。关国光说:“快钱采用了各种机制来保证用户资金的安全性,例如回款机制等,可以在用户付款过程由于各种意外因素中止或未完成时,系统将用户账户自动回复到交易开始时的原始状态。”除此之外,快钱也建立了一系列监控机制,有问题的交易系统会被强制暂停两天以供审查。内部财务方面则遵守相互监督的原则,不会让任何一个人参与主导交易全程。在交易的识别方面,快钱有一套交易过滤引擎,可以识别出较明显的问题交易行为。 14 |   增值服务:网络支付的撒手锏 15 |   在关国光看来,快钱平台可以提供详细的用户行为记录,进而方便商户掌握用户的喜好和需要。这种增值服务对于支付平台至关重要。 16 |   在市场推广方面,快钱公司市场推广的目标就是让用户知道快钱这个品牌,然后将精力集中在核心应用上。“快钱的策略就是同主流应用相捆绑,致力同大厂商合作,因为目前大型门户所掌握的用户资源是相当多的。” 17 |   “我们不必去强迫用户使用快钱,因为网络支付只是交易过程中的一个附加品,单推一个支付平台是没有效果的。”关国光表示,“快钱的策略就是要找准交易,捆绑和依托在上面,用户在进行电子交易时,自然而然就会用到我们的支付平台。” 18 |   除此之外,快钱的策略是先稳定一批活跃用户后,再将目光放到普通用户上。关国光把快钱的营销模式称为非线型营销,“一个注册用户在支付交易中往往会带入一个未注册用户,用户之间的互动会形成网络效应。” 19 |   从创业开始,快钱的商业模式就没有变化过。“快钱的后端绝不做应用。”关国光信誓旦旦地表示。他认为一旦快钱做了应用,将面临更多的竞争对手,同时也违背了自己独立的第三方支付平台的市场定位。 20 |   快钱未来的梦想是:首先,将所有的支付工具整合为一个接口,随着流量的增加,给商户带来的价值是一样的,但成本更低。其次,快钱拥有用户的详细数据资料,可以实现数据库营销,为客户提供增值服务,例如支持客户的促销、推广等,或者为客户创造商业机会。 21 |   2005年8月,快钱公司获得美国DCM和半岛基金的首批风险投资,第二轮目前还在评估之中。关国光表示,对快钱来说,融资是一件水到渠成的事情,是最后考虑的问题。快钱挑选风投的条件只有两个,一是必须在中国有过投资;二是在中国的投资必须取得过成功。 22 |   “电子支付行业是一个入行容易、生存难的行业,”关国光说,“任何企业要在这个领域取得成功,就必须脚踏实地地认真去做,绝不能抱着投机的心理。” -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000008/11.txt: -------------------------------------------------------------------------------- 1 |   焦点个股:苏宁电器(002024),该股早市涨停开盘,其后虽在获利盘的抛压下略有回落但在强大买盘的推动下该股已经再次封于涨停,可见主力资金积极拉升的意愿相当强烈。 2 |   盘面解析:1.技术层面上,早市指数小幅探低后迅速回升,在中石化强势上扬的带动下指数已经成功翻红,多头实力之强令人瞠目结舌。不过在市场高度繁荣的情形下投资者也需谨慎操作,必竟持续的上攻已经消耗了大量的多头动能。 3 |   2.盘中热点来看,相比周二略有退温。但依然可以看到目前热点效应向外扩散的迹象相当明显。高度活跌的板块已经从前期的有色金属、金融地产股向外扩大至军工概念、航天航空等。 4 |   操作思路:短线依然需规避一下技术性回调风险,盘中切记不可追高。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000008/12.txt: -------------------------------------------------------------------------------- 1 |   智威汤逊全球CEO:大众传媒依然是品牌传播的好选择 2 |   本报记者康健发自上海 3 |   “想让品牌更快、更广地进入消费者,大众传媒仍然是很好的选择。”智威汤逊全球CEO Michael Maedel近日在上海的办公室告诉《第一财经(相关:理财 证券)日报》。他对有些人“电视、平面媒体失去意义”的观点不以为然。 4 |   智威汤逊是美国最大的广告公司之一,与奥美广告一起隶属于WPP集团,3月底刚刚收购了中国本土的上海奥维思市场营销服务公司。 5 |   大众媒体和互动媒体对半 6 |   针对新的媒体方式日益涌现,企业广告主投放广告越来越无所适从的情景,Michael认为,广告主应该进行定性定量的分析,使任何投放都有清晰的出发点:消费者。要让媒介触及消费者,使他们更愿意来倾听公司。 7 |   当然,在媒介越来越多的情形下,意味着传播方式的变化。过去主流的是大众传播,现在互动性和定制性带来了新的挑战——如何让品牌与消费者更加互动。 8 |   智威汤逊东北亚区域总监兼大中国区CEO唐锐涛则认为,中国面临两个挑战:品牌主张明确化和如何深化与消费者的关系。 9 |   他认为,大众品牌并未失去其价值,借助大众媒体可以清楚地传达品牌的真实含义。而在此基础上,还需要更新的形式使产品和消费者的关系进一步深化。通过互动媒体,可以将以往被动的关系变成主动对话的消费者关系。 10 |   唐锐涛的经验法则是,在进行投放的时候,大众媒体和新媒体“对半开”,前者致力于建立品牌,后者用于深化与消费者关系。 11 |   同时,产品根据消费者参与的程度也分为高消费者参与度产品和低消费者参与度产品。使用媒介取决于产品本身的复杂度。如饼干等不假思索就购买的产品,大众媒体作用比较大。汽车等奢侈品需要增加对话和互动,让消费者深入这个品牌。 12 |   全球品牌,本土特色 13 |   Michael特别强调品牌的全球定位和本地表述。他提到,即便广告主是洗衣机,在各个市场,洗衣机的价格跟消费者的工资比例不一样,有些市场用2天的工资就可以买一台,而有些市场,消费者需要用自己三个月的工资才能购买到。这样的情况下,消费者的参与度就完全不一样了。那些用三个月工资才能买得起洗衣机的人会花更多时间去了解产品的性能是否耐用,这跟成熟市场完全不同。 14 |   “本地化并不意味着把全球广告翻译成中文,这是一种拙劣的方式。”Michael 称。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000008/13.txt: -------------------------------------------------------------------------------- 1 |    新华网上海5月10日电 中国石化集团上海工程有限公司最近与中石化第二建设公司、荷兰AK公司组成联合体,一举成为沙特延布年产40万吨聚乙烯和40万吨聚丙烯生产装置项目的总承包商,总承包金额7.5亿美元,其中上海工程公司承包金额4.65亿美元。 2 |    据《解放日报》报道,目前,沙特石化项目的基础设计工作已接近尾声,其中上海工程公司派出20多人赴荷兰参与设计。项目详细设计工作将于年底结束。明年年初施工开始,直至2008年4月竣工。这期间,大批中国设备、材料将运往红海岸边,四五百名中国技术、管理和施工人员将奋战在异国土地上。 3 |   两年前,上海工程公司得知沙特基础工业公司决定在红海西岸的延布建设大型石化联合企业,而AK公司正参与其中部分装置的竞标。权衡利弊,上海工程公司决定放弃单打独斗而与AK公司携手,提出三方组成联合体参与竞标的设想。中外三方过去在其他项目上多次合作,相互知根知底,因此一拍即合,很快签订合作协议参与竞标。如此优势互补,果然在竞标时将所有对手远远地抛在了身后。 4 |   根据总承包合同,荷兰AK公司负责项目基础设计,上海工程公司派人参与;项目详细设计由上海工程公司负责完成,AK公司给予支持。项目主要设备、仪表、主要电气设备,由AK公司负责采购,其余设备和大宗材料由上海工程公司负责采购,项目施工由第二建设公司负责实施。 5 |   上海工程公司是一家具有53年历史的国内大型工程设计承包企业,先后成功完成了上海化工区总体规划设计,上海石化、扬子石化、杜邦纤维等国内外4000多项设计和承包工程。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000008/14.txt: -------------------------------------------------------------------------------- 1 |   根据艾瑞市场咨询有限公司发布的2005年《中国网上支付研究》报告,中国网上支付的市场规模在2001 年为9 亿元,2004 年就达到了75亿元,年均复合增长率为102.7%。艾瑞预测2007年我国网上支付市场规模将达到人民币605亿元。 2 |   应该说在超过4亿个手机用户和1亿多网民支撑下,网上支付市场的想象空间无疑是巨大的。 3 |   对此,北京YeePay公司首席执行官唐彬甚至认为,支付需求现在已经是国内未被满足的最大需求。但2005年以前,作为结算支付主体的商业银行在面对大量低端商户支付业务时显然是一种不在乎、视而不见的态度。在这种情况下,商业银行选择向支付公司提供支付网关接口,将网上支付业务外包给支付公司,正如eNet硅谷动力商务运营部总监张磊所说的那样,支付公司成为商业银行支付业务的总代理商。 4 |   面对网上支付公司的崛起,商业银行开始觉醒起来,采取措施应对威胁;另一方面,网上支付公司也暴露出它监管上的弊病。原6688商城拖欠挪用商户结算款就是明例。 5 |   这个时候传出央行要在2006年出台《电子支付指引(第二号)》文件,即《支付清算组织管理办法》的消息,主要内容被认为是“关系到第三方支付公司的牌照发放”,据了解,在电子支付领域,牌照数量不会超过10张;对于清算体系,央行的原则是“以央行作为主导,商业银行作为主体,社会组织作为补充”,而以快钱公司为代表的第三方支付公司就属于“社会组织”。另一家第三方支付商好购公司总经理何明攀在接受《第一财经(相关:理财 证券)日报》采访时表示央行之所以要出台管理办法就是为了防止网上金融欺诈和无序竞争,规范网上支付市场。 6 |   易观国际认为,随着今年底金融业全面开放的大限临近,中国第三方支付市场的重组与洗牌将在所难免,在目前国内40家左右的第三方支付服务商中,至少有一半会出局。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000008/15.txt: -------------------------------------------------------------------------------- 1 |   本报讯 (记者李英辉)已经退出北京市场两年多的车贷险业务重现市场。记者昨天获悉,安邦财险将在本月启动车贷险业务。 2 |   购买车贷险后,一旦贷款人不能还贷款,保险公司要负责赔偿银行贷款。该险种面市后,曾极大地促进了银行车贷业务的发展。由于车贷险的赔付率竟然超过100%,保险公司不堪重负,两年前全面退出市场。 3 |   新车贷险做了重大调整。原来只要被保险人逾期还款,保险公司就须代其还款。新条款中,保险公司的履约责任由第一位降到第二位,如出现被保险人逾期还款的现象,先由银行和汽车公司追偿,然后进入保险公司赔偿程序。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000008/16.txt: -------------------------------------------------------------------------------- 1 |    本报北京5月9日讯 记者潘跃今天从中国红十字会总会举办的“博爱论坛”上获悉:目前,全国已有641个县(市、区)开展试点工作,有1.63亿农民参加了合作医疗。试点地区农民的医疗负担有所减轻,因病致贫、因病返贫的情况有所缓解。 2 |   据有关资料显示,我国医疗资源分配极不均衡,占全国人口20%的城市人口占有我国卫生资源的80%,而占全国人口80%的农村人口仅占有20%的卫生资源。近年来,由于医疗服务保障的城乡差异,大城市的人均寿命比农村高12年,而贫困地区儿童死亡率则是大城市的9倍。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000008/17.txt: -------------------------------------------------------------------------------- 1 |   设想一下,如果某家银行花了大力气进行品牌建设,可顾客每每面对的是铁栅栏后面一张冷冰冰的脸,敷衍推诿,甚至恶语相向,他们自然很难相信这家银行所作的品牌承诺,也会动摇对银行的信任 2 |   本报记者范松璐发自上海 3 |   在一个金融服务品牌提升研讨会上,扬特品牌欧洲的董事长TerryTyrrell饶有兴趣地展示了一些别出心裁的银行标志,从图案的设计中很容易发现为人们所熟悉的知名公司品牌的影子,比如麦当劳那个醒目的“m”和苹果电脑缺了口的苹果,而类似可口可乐的标志下,索性写着“CocaCash”,看到这些易于识别和引发联想的标志,台下观众发出一阵阵会心的笑声。 4 |   “当然,这些银行标志只是我的想象,不过,目前在金融服务业领域,有没有像这几家企业那样影响深远的品牌呢?恐怕还没有。”Terry说。在激烈的竞争环境中,弱势品牌可能会被猎食,不过,只知道掏钱购买弱势品牌、而并不能建立一个强大品牌的猎食者也未必能得到良好的投资回报。对现有的银行而言,建立自身的强势品牌适逢其时,而且相当重要。 5 |   应求与众不同 6 |   国内金融服务业暗流汹涌。2006年是中国进入WTO,承诺开放金融市场的关键一年,外资银行即将进入,竞争格局正发生变化,市场内部也萌生诸多影响零售银行业务成长的因素——高强度的经济发展、政府收缩对社会福利的补助、房屋私有率提高、人口日益老龄化、个人消费成为经济发展的关键动力,而且企业银行业务要利用总体性平衡来管理中小型企业贷款、开发收费产品。 7 |   讲到银行现存的症结,人们的第一反应往往是不良贷款比率偏高、风险评估实战经验不足、消费性金融产品缺失、企业管理标准不够完备等等。但另一方面,不容忽视的是,国内银行的品牌建设也存在某种滞后——鲜有差异化的品牌定位、品牌经营思维和以客户为本的鲜明形象,顾客感受到的环境和服务面目雷同,甚至干脆一模一样。扬特中国区创意总监黄鼎杰展示了一页图片,是某家知名商业银行的营业厅,“能看出来这是哪一家银行吗?”的确,对多数人来说,只能感觉似曾相识,却基本无从分辨究竟是哪一家。 8 |   再看银行的图标,如果把具体的图案及字体隐去,会发现图标的颜色和形状极其接近,比如四大国有商业银行的图标都是圆形图案加上银行名字。“圆形,应该是钱币的意思,不过是否可以改换一下视觉形象,让自己更醒目些,区分性会带来更多机会。”黄鼎杰还展示了某家美国银行的营业厅照片,乍一看去,难以想象这居然会是银行,而更像一家前卫酒吧——设计活泼明快,各种独特有趣的细节点缀夺人眼球,还有咖啡台和上网的电脑,“在这样的银行里,等待也似乎不那么让人心焦了——不过这种风格在国内还是有些超前,可能很多人会不放心把钱放进去。”黄鼎杰觉得,毕竟大多数顾客对银行的期望还是以“专业、安全、权威”为主,在此基础上,如果适当加入更多“友善、亲切”的元素,会进一步提升银行在顾客心中的形象。比如在香港,大多数银行的保安并不穿制服,这些细节往往能拉近顾客的心理距离。 9 |   对银行来说,通过识别系统、广告活动等方式来建立品牌构造是远远不够的,必须有更高标准,还要更多地从感情上联结顾客,建立强烈的认同感。银行业正在掀起一场争取客户心智的战役。 10 |   别让冰山倾覆 11 |   Terry展示了一幅冰山的图片,在他看来,人们从外面感受一家企业,就如同看到露出海面的冰山,其中包括品牌的定位、个性、表述等方面,而水面以下深藏不露的更大部分则是企业自身对内的战略、愿景、价值和激励,这些是令品牌长久保持活力的源泉,作用更为关键,正所谓“吸引人的真实”(com p e llin g tru th)。露出水面的冰山可以吸引外界注意,但倘若缺少真实的根基,冰山终究难逃倾覆的命运。 12 |   很多企业在努力建立和管理品牌的时候,不觉间会犯一个错误,只把注意力聚焦在顾客身上,而忽略了对员工的沟通、了解和重视。 13 |   “如果不能把员工培养成忠实的内部品牌拥护者,那就太可惜了。”扬特中国区董事总经理Debora Chatwin 认为,前线员工应该成为真正的品牌大使,发挥独特能力,和顾客建立良好关系,给公司带来利润,自己也得到更大的满足。 14 |   员工投入度对公司的回报影响不可忽视,《星期日泰晤士报》在2002年一项“最佳雇主”调查中也指出,获得雇员好评的公司股价和股息收益增幅达25%,远高于同期英国全股指数6.3%的上涨幅度。再回到国内,盖勒普2004年进行了一项调查,将工作的人们分为“投入型”、“不投入型”、“积极投入型”三种类型,结果显示,有68%的人属于“不投入型”,对工作没有激情,觉得工作与自己个人关系不大,工作时几乎形同梦游。粗暴、冷漠、不满足的员工会伤及客户和公司自身,身处服务业的银行更是如此。 15 |   设想一下,如果某家银行花了大力气进行品牌建设,可顾客每每面对的是铁栅栏后面一张冷冰冰的脸,敷衍推诿,甚至恶语相向,他们自然很难相信这家银行所作的品牌承诺,也会动摇对银行的信任。许多国有商业银行在此方面可能需要多一些反思。“领导层的重视是使得员工与品牌紧密联结在一起的重要因素。”Terry表示。 16 |   “员工联结”修固品牌根基 17 |   银行的顾客细分、产品开发、风险管理都需要高水平的管理者和职员,有些人才要从外部市场引进并整合到银行的运营和文化中,这一点上,超越金钱奖励而创造积极向上的企业文化可能更为长远。 18 |   渣打银行在员工联结方面的努力产生了一定的效果,面对资源收缩、员工士气开始低落的现象,银行开展了名为“树立典范”(TaketheLead)的内部沟通计划,希望将所有人力资源和传播活动加以整合,清晰传递管理层的承诺,对员工进行积极有效的奖励,使他们重获工作的信心和自豪感,表现自己的领导才能。 19 |   计划的代言人是一个活泼的卡通人物“StarMan”(星仔),它的各种形象代表了各种“树立典范”的行动,力求将抽象鼓励变成具体榜样。渣打银行向高级经理们发放一套介绍计划的录像带和新的员工通讯录,贯彻名为“JustSayThankYou”(说句谢谢您)的员工表扬计划,用有“星”形象的卡片给努力工作的同事写谢谢,公司刊物也更名为“TheLeader”(典范)。另外,银行在对外的信息传递中也采用很多“星仔”标志,这一切都使员工对整个计划的印象不断深化,并逐步加强认同感。最终,顾客满意度显著上升,员工流失减少,对品牌内涵的理解更深。 20 |   “员工联结”不只是让大伙儿了解正在发生的事情,更要得到他们的投入和参与,与品牌之间产生一种紧密的情感。这样不仅能使冰山露出水面的部分看上去很美,深埋在水下、不易为人所见的真实根基也会更加牢固,做到这些,依靠银行自身长久的修为。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000008/18.txt: -------------------------------------------------------------------------------- 1 | 2 |   如果你周围的不少人都晋升了,那就该好好反省自己了。看看以下种种晋升“绝症”,是否有自己的身影呢? 3 |   职位成功晋级,事业更上层楼,这是不少经理人的职业目标。然而,很多经理人努力打拼却依旧还在原地徘徊。 4 |   在竞争社会,当你不能升职的时候,要先考虑是企业体制的问题,还是你自己的问题。如果是体制问题,你可能根本就没有机会,完全可以选择主动离开。如果你周围的不少人都晋升了,那就该好好反省自己了。看看以下种种晋升“绝症”,是否有自己的身影呢? 5 |   失语症——上司换了8个,我还是当绿叶 6 |   邓珉在一家知名房地产物业公司做行政人事主管,从2001年到现在,公司先后换了两任老总,换了8个项目经理,每个项目经理升职调走了,而她却一直在原地不动。让邓珉困惑的是,她要不停地适应新领导的管理风格,而且自己的发展空间有限。物业公司的行政人事工作并不复杂,她只要用30%的精力就足够应付得了。公司也一直认为邓珉是个老同志,比较稳定塌实,哪里需要就让邓珉过去。 7 |   “失语”诊断:邓珉一直在做默默无闻的“失语”绿叶,整整陪衬了8位上司。行政支持工作并不是最“抢眼”的红花,企业很容易把你定性。虽然你在公司给大家留下了不错的印象,但企业往往是哪里需要你,就把你往哪里搬。 8 |   药方:生意就是生意,经理人要更多地考虑自身的利益,衡量自己的投入和产出,千万别做赔本的买卖。想要晋升,就要勇于表现出来,要捅破这层窗户纸。第一,想要。第二,要做。第三,要让老板知道。一定要向老板提出你的想法,你可以结合企业的资源和现状来分析,要让老板意识到,你的确想要承担更大的责任。另外,表明你现有工作做得不错,你也有这样的能力。在企业环境相对稳定时,企业在重用一个人的时候,看重的不是能力,而是信任。这方面你有优势。 9 |   自闭症——就盯着自己的一亩三分地 10 |   一年前,业绩出色的路平被破格提升为企划经理,但他还是走业务路线,手底下没兵,只有一个助理协助他。他一直对市场企划总监这个职位心仪已久,没想到最后却被能力、业绩远不如自己的同事PK下来。 11 |   原来,一向喜欢单打独斗的路平总是有点各色,他只愿意盯准自己那一亩三分地。例会时,部门讨论其他市场活动方案,他总是一言不发。等到询问起他的意见时,他便说,“不好意思,我没来得及看。”平日的团队活动或是聚会,也难见他的身影。老板用人所长,结果导向,对路平也是睁一只眼闭一只眼。但同事们不免背后嘀咕,说路平小农意识。 12 |   “自闭”诊断:各色的路平眼里只有自己那一摊。在结果导向、业绩为王的公司,这样也许没错。但在晋升路上,过分的“自闭”会让上司有所顾虑,同事的反作用力也会断送你的晋升良机。 13 |   药方:职场中人人都是生意伙伴,上司、同事都是价值链上的客户和资源。只盘算着自己的眼前利益,往往会失去更多“商机”。路平要积极和同事们主动交往,能者多劳,既然你点子多,不妨多给同事们出一些好创意,而你在支持同事的同时,不仅获得了一个好人缘,进而也熟悉其他业务线,增强了自身的实力。如果其他业务线你也能轻松玩转的话,上司一定会给你更多机会的。 14 |   狂妄症——“我就愿意让别人听我的” 15 |   安妮是一家呼叫中心项目部的客服经理,她刚上任不久,就引起了下属的极度不满,而且被投诉到公司总部。 16 |   原来,安妮个性强势,上任后就进行了一系列改革,重新排班,规范服务,整顿流程等等。改革取得了一定成效,以前忙乱的客服工作逐渐变得有序,但安妮自己却引起了一片倒伐之声。当下属在外面忙得团团转时,她却在自己的单间里会客聊天,而且经常不来上班。而自由散漫的安妮对下属却是实施高压手段,用她的话来说,“我就愿意管人,让别人听我的。”她安排自己的亲信任职,监视其他下属言行,搞得员工怨声载道。几个月后,项目高管调整,其他几个项目的中层都获得了提升,惟独安妮没有新的发展空间,最终辞职而去。 17 |   “狂妄”诊断:安妮有着强烈的领导欲望,管理风格泼辣强悍,但她却忽略了接受方的感受。改革虽然初见成效,但她自己却难为表率,严人宽己的领导风格必然难以服众。 18 |   药方:狂妄的强权不是万灵药,身为管理者,安妮既是规则的制定者,也是规则的裁判,如果自己都处处破坏规则,一时的业绩也只能是短期效应。而下属员工是经理的供应商,水能载舟,也能覆舟,业绩是需要大家一起努力做出来的。安妮如果早些努力调试自己,采取一些柔性管理手段,避免激进改革,以身作则让员工口服心服,也不至于在项目调整时弄得丢盔卸甲。 19 |   多动症——不开心就跳,越跳越迷茫 20 |   30出头的汪力已经换了6家企业,现在一家IT企业任数码产品经理。年轻时为了薪水而跳,把跳槽当成涨薪的跳板,往往是这家企业还没彻底了断,就已经在下家开始领薪水。近一年来,汪力倒还算得上稳定,一直没什么非分之想。但上个月,公司的产品总监换成了一个台湾老板,对汪力似乎有些看不顺眼,重要业务会议不让他参加,一些产品的推广预算也卡得很紧。汪力感觉自己不被信任,正逐渐被边缘化,他又动了大不了走人的念头。 21 |   汪力把自己的简历给了一家猎头,没想到猎头却称,他跳槽频率过快,如果要晋升高职,希望并不大。如果平级跳,汪力又不甘心。 22 |   “多动”诊断:通常,猎头非常不喜欢频繁跳槽的人,因为频繁跳槽说明此人目标不清晰,对公司的忠诚度值得怀疑。汪力一直对自己期望较高,如果现实稍不如意,便有“弃暗投明”的念头。但频频转换,跳成了习惯,在每一个职位上都不能积累较多的资本,更谈不上为晋升打下坚实根基了。 23 |   药方:在猎头眼中,在一家公司中高层职位上干满3年的候选人是比较理想的。汪力如果认准了行业,就要努力埋头做下去,没有完美的企业和上司,你在这家企业被边缘化,如果不能咸鱼翻生的话,再换一家也同样如此。只有想清楚自己的目标,稳扎稳打,步步为营,用实在的业绩说话,下一个晋升机会才不会擦肩而过。 24 |   其他非典型晋升“绝症” 25 |   1.“红眼病”,容不得他人比自己能干,喜欢背后冷嘲热讽。 26 |   2.“营养不良”,知识和能力总是跟不上企业步伐。 27 |   3.“骨质疏松”,没有主见,人云亦云,就会做老好人。 28 |   …… 29 |   第N种:“抑郁症”,非黑即白,抱怨连连却缺乏行动力。 30 |   (文章出自:前程无忧〈人力资本〉杂志) -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000008/19.txt: -------------------------------------------------------------------------------- 1 |   本报讯 (记者段志敏)中国移动北京地区手机资费刚刚下调,零售终端迅速作出反应。昨天下午,北京苏宁电器宣布本周末起手机大降价。包括诺基亚、摩托罗拉、索爱、三星等主流品牌在内的手机降幅将超过20%。 2 |   北京苏宁电器市场部经理徐正飞说,此次降价外资手机是主力,诺基亚降价机型多达10款,摩托罗拉和索尼爱立信降价机型也分别达到8款和6款。不少外资品牌新机型降幅超过20%。 3 |   苏宁电器华北地区管理总部执行总裁范志军认为,北京移动资费首次大幅调低,必将刺激北京手机市场消费,带来新增长,预计市场增幅应在30%以上。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000010/10.txt: -------------------------------------------------------------------------------- 1 | 2 |   本报讯 (记者 王京) 联想THINKPAD近期几乎全系列笔记本电脑降价促销,最高降幅达到800美元,降幅达到42%。这是记者昨天从联想美国官方网站发现的。 3 |   联想相关人士表示,这是为纪念新联想成立1周年而在美国市场推出的促销,产品包括THINKPAD 4 | T、X以及Z系列笔记本。促销不是打价格战,THINK品牌走高端商务路线方向不会改变。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000010/11.txt: -------------------------------------------------------------------------------- 1 |   本报讯 全球最大个人电脑制造商戴尔公司8日说,由于市场竞争激烈,以及定价策略不当,该公司今年第一季度盈利预计有所下降。消息发布之后,戴尔股价一度下跌近6%,创下一年来的新低。 2 |   戴尔公司估计,其第一季度收入约为142亿美元,每股收益33美分。此前公司预测当季收入为142亿至146亿美元,每股收益36至38美分,而分析师平均预测戴尔同期收入为145.2亿美元,每股收益38美分。 3 |   为抢夺失去的市场份额,戴尔公司一些产品打折力度很大。戴尔公司首席执行官凯文·罗林斯在一份声明中说,公司在售后服务和产品质量方面一直在投资,同时不断下调价格。戴尔公司将于5月18日公布第一季度的财报。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000010/12.txt: -------------------------------------------------------------------------------- 1 |   本报讯(记者 陆一波)售价8.5万港元的《文渊阁四库全书电子版》在易趣网上竟以60元的价格拍卖。为此,拥有该电子出版物版权的迪志文化出版有限公司将共同经营易趣网的上海易趣贸易有限公司和亿贝易趣网络信息服务(上海)有限公司告进法院。昨天,市二中院开庭审理此案。 2 |   去年11月,迪志公司发现易趣网未经其许可,允许并配合其用户在网上公开拍卖该电子出版物,且这17张光盘均属盗版。迪志公司将易趣网的经营公司告进法院,要求立即停止侵权,赔偿经济损失人民币50万元并刊登致歉声明等。 3 |   易趣网的代理律师辩称,易趣网仅是网络交易的专用平台,未直接实施侵权交易,且网上已设知识产权查询系统,供权利人举报。该公司已尽合理范围内的注意义务,没有责任。 4 |   庭审中,法院发现《文渊阁四库全书电子版》的版权由迪志公司和上海人民出版社共同所有,故宣布该案将在上海人民出版社参加诉讼后继续开庭审理。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000010/13.txt: -------------------------------------------------------------------------------- 1 |   关键字:裁员 美国在线 呼叫中心 2 |   标题:美国在线计划裁员1300人占全球员工总数7% 3 |   时间:美国东部时间5月9日上午10时30分消息 4 |   来源:英文雅虎 5 |   内容摘要:美国在线计划裁员1300人,约占其全球员工总数的7%,位于费罗里达州杰克逊维尔呼叫中心将被关闭,此外,位于犹他州奥格登美国亚利桑那州图森的呼叫中心也被列入此次裁员的范围。这是自去年秋天美国在线裁员700人以来最大规模的一次人员精简行动。去年10月份,面对拨号上网用户数量持续下跌,美国在线关闭奥兰多的呼叫中心,位于杰克逊维尔和总部杜勒斯的呼叫中心有部分职位被削减,总共裁员700人,约占其全球员工总数的4%,尽管美国在线的用户流失现象严重,但该公司的发言人尼古拉斯-格拉汉姆将这一结果归咎于用户对电脑的日益了解以及更多工具的出现,他表示:“与1996年美国在线建立会员中心相比,2006年的英特网世界是一个完全不同的世界,美国在线的会员们头脑更加灵活,具备更加丰富的电脑知识,他们几乎都是电脑通,一般的故障都能自己排除,呼叫中心的功能日趋减弱。”一项数据显示,自2004年以来,美国在线的呼叫量下降了近一半。 6 |   关键字:手机销售 排名 瑞典 7 |   标题:4月份Telia商店手机销售排名前10位 8 |   时间:美国东部时间5月9日上午11时35分消息 9 |   来源:法新社 10 |   内容摘要:瑞典最大的通信产品零售店Telia今天公布2006年4月份手机销售排行榜,进入销售前十的手机中索爱占5款,诺基亚占3款,三星占2款,其中有两款是3G手机(诺基亚6280和三星Z140),六款有照相功能,六款有MP3播放功能,具体的排名为:排名前十位的手机为:(1)索爱K750i(上月排名第四)、(2)诺基亚3120(上月排名第三)、(3)诺基亚5140i(上月排名第一)、(4)索爱Z300i(上月排名第五)、(5)诺基亚6280(与上月的排名一致)、(6)索爱W810i(与上月的排名一致)、(7)三星X660(与上月的排名一致)、(8)索爱Z520i(上月排名第二)、(9)索爱W800i(上月排名第六)、(10)三星Z140(上月排名第九)。Telia是瑞典最大的移动电话零售店,拥有78个商店,该排名就是依据各商店的销售数据得出的结果,Telia市场部的负责人指出,“照相以及MP3播放功能已经成为许多客户对手机的基本要求,手机用户对于移动电视的需求也在不断增加。” 11 |   关键字:业内合作 下载 电视连续剧 12 |   标题:苹果公司提供福克斯娱乐集团出品的电视连续剧的下载 13 |   时间:美国东部时间5月9日上午11时20分消息 14 |   来源:英文雅虎 15 |   内容摘要:苹果公司日前宣布,iTunes音乐商店(Music Store)已经开始销售福克斯娱乐集团出品的电视连续剧,例如此前风靡全球的《24》。苹果公司介绍称,每部电视连续剧的下载费用为1.99美元,除了《24》之外,《盾牌》、《越狱》、《吸血鬼猎人巴菲》也在下载之列。此前,iTunes音乐商店提供来自ABC、CBS以及NBC的节目下载服务。 16 |   关键字:民意测验 电子游戏 美国 17 |   标题:40%美国成年男子玩电子游戏 18 |   时间:美国东部时间5月9日上午10时20分消息 19 |   来源:英文雅虎 20 |   内容摘要:美联社与美国在线近期开展的一项民意测验显示,十个成年美国男人当中有四人通过电脑或者游戏机玩电子游戏,其中有45%的人通过因特网玩电子游戏,多于三分之一的人2005年花费在网络游戏上的资金达到两百美元,42%的人每周玩电子游戏的时间超过了四个小时,26%的人通过游戏机玩电子游戏,六分之一的人每周在线玩游戏的时间为十个小时。关于游戏的内容,战略游戏最受欢迎,其次为体育游戏,冒险游戏还有射击游戏以及仿真游戏。 21 |   关键字:打击盗版 下载 华纳兄弟 22 |   标题:华纳兄弟计划通过BitTorrent提供影片下载服务 23 |   时间:美国东部时间5月9日上午11时55分消息 24 |   来源:英文雅虎 25 |   内容摘要:美国娱乐业巨头华纳兄弟公司(Warner Brothers)将成为第一家向BitTorrent用户提供电影内容下载服务的公司,该公司希望通过此举打击盗版行为。华纳兄弟家庭娱乐公司总裁Tsujihara表示:“盗版的问题变得越来越严重,我们的这种作法是将这一问题变成一种机会,如果我们能够将5%,10%甚至是15%的这些用户转化成合法的用户,其影响力将会十分的重大。”华纳兄弟公司指出,用户可以租用或者下载那些可以被制作成DVD的拷贝,但是此项服务推出日期以及具体的定价目前还不得而知。此前,华纳兄弟准备将电影如《蝙蝠侠》、电视连续剧《玩酷世代》等影片通过P2P网络在网路上销售。该公司一负责人指出,成功打败目前线上剽窃行为最有效的武器之一就是向用户提供合法且容易使用的替代性选择。In2Movies服务使观众能够合法下载华纳旗下百视达的电影、地区性节目。 26 |   关键字:业绩 荷兰电讯公司 净收入 27 |   标题:荷兰电讯公司Royal KPN NV周二表示其第一季度净收入达到3.83亿美元 28 |   时间:美国东部时间5月9日上午11时20分消息 29 |   来源:道琼斯新闻 30 |   内容摘要:荷兰电讯公司Royal KPN NV周二表示其第一季度净收入达到3.83亿美元,比去年同期的2.74亿美元增长了40%,销售收入也达到了37.2亿美元。在固定电话部门收入下降2.3%达到21.4亿美元的情况下,移动收入增长了15%,达到了19亿美元。此外,该公司在德国新增加用户70万。 31 |   关键字:新举措 漫游费 沃达丰 32 |   标题:沃达丰表示将在明年降低手机漫游资费 33 |   时间:美国东部时间5月9日上午10时25分消息 34 |   来源:道琼斯新闻 35 |   内容摘要:迫于欧洲委员会的压力,英国电信巨头沃达丰公司(Vodafone)近日表示将在明年降低手机漫游资费,其低价幅度将达到40%。欧洲委员会此前的建议称,当欧洲用户出国后,他们不应该被收取漫游费,不能因为他们出国旅行而缴纳更高的费用。 36 |   关键字:新产品 超薄手机 三星 37 |   标题:三星公司在莫斯科电信展推出两款超薄手机 38 |   时间:美国东部时间5月9日上午10时40分消息 39 |   来源:英文雅虎 40 |   内容摘要:在莫斯科的Sviaz ExpoComm 2006电信展上,三星公司推出两款超薄手机,其中一款为SGH-X820,厚6.9毫米,重66克,内置200万像素摄像头和MP3播放器,容量80MB,支持视频录制、蓝牙和电视输出。另外一款为滑盖式手机SGH-D900,厚度及重量比SGH-X820稍大一些,内置300万像素摄像头,支持Quad-band GSM网络,但三星公司并没有透露这两款手机的价格。 41 |   关键字:服务 高清晰 数字广播 42 |   标题:英国广播公司(BBC)首次推出免费的数字广播服务 43 |   时间:美国东部时间5月9日上午7时10分消息 44 |   来源:路透社 45 |   内容摘要:英国广播公司(BBC)本周内首次推出了使用电视格式的高清晰数字广播,这项服务将进行为期一年的试验。根据此前英国广播公司所作的调查显示,了解高清晰数字广播的听众都期待着BBC尽早开通高清晰数字广播服务,并希望在任何频道都能收到该广播。据报道,该项广播将从5月11日正式开通,开通之初仅限于拥有高清晰设备的用户。BBC公司同时还证实了在世界杯期间,在某些地区数字广播能用电缆进行传播。从6月9日开始,BBC公司将对世界杯进行高清晰无线电和电视的同时联播。这种联播还将应用于温布尔登主要的赛事。BBC电视部门总监加纳?贝内特(Jana Bennett)说:“高清晰数字广播是BBC公司计划在未来向全世界提供高清晰服务的而迈出的第一步,虽然步幅小,但是是激动人心的。” 46 |   关键字:电脑黑客 审判 服刑 47 |   标题:美国电脑黑客安契塔被判入狱57个月 48 |   时间:美国东部时间5月9日上午10时35分消息 49 |   来源:法新社 50 |   内容摘要:美国电脑黑客安契塔被判入狱57个月。检方指出,安契塔,20岁,是知名秘密骇客网络“地下蠕虫大师”的要员,于去年十一月被捕,这是第一起遭起诉的相关案件。他被控侵入四十万余部电脑(或称僵尸网路,bot nets)损害其系统,并促使受害电脑大量寄发垃圾邮件。遭安契塔入侵的,还包括美国军方的服务器。 在洛杉矶的联邦法庭上,面对17项指控,安契塔承认密谋违反电脑诈欺滥用法、反垃圾邮件法,和损及美国军方电脑。他并坦承散播能促使电脑发送垃圾邮件、广告以及对网站发动瘫痪性攻击的恶意软体。 检方发言人莫柴克说:“安契塔尤其对这一连串的秘密犯行负有责任,他入侵加州近五十万部电脑系统,受波及的电脑并不限于家用电脑,这也让他与他人得以发动大规模的攻击。” 安契塔在庭上同意赔偿军事单位一万五千美元,他的不法获益也遭没收,其中包括逾六万美元现金、一辆BMW汽车与一些电脑设备。(章田编译) -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000010/14.txt: -------------------------------------------------------------------------------- 1 | 2 |   本报讯(记者 马海邻)记者昨天得到确切消息,新浪公司今天将宣布由曹国伟接替汪延担任CEO,汪延则任董事会重要职位。 3 |   曹国伟此前是新浪总裁兼CFO(首席财务官)。他于1999年加入新浪,任主管财务的副总,之后任职CFO、CFO兼COO(首席运营官)。曹国伟先后获得复旦大学新闻学学士、美国奥克拉荷马大学新闻学硕士学位,1993年获德国奥斯町大学商业管理学院财务专业硕士学位后,任职普华永道。其人被外界评价为强势的鹰派管理风格,曾获《首席财务官》杂志和IDG中国共同评选的“2005年度杰出CFO”。 4 |   外界认为,由曹国伟主导的2003年1月收购讯龙、2004年3月收购深圳网兴科技,这两笔收购不仅奠定了新浪此后在无线增值业务上的地位,同时也增加了新浪经营模式的多样性与稳定性,对新浪意义非凡。新浪董事会对公司2005年以来业绩的滑坡、非广告业务收入下滑感到忧虑,希望曹国伟能够力挽狂澜,加强新业务的拓展。 5 |   汪延于2003年5月取代茅道临出任新浪CEO。有关新浪再次换帅的传闻,起于去年下半年。昨晚新浪内部一名高层人士证实,今天在发布财务季报的同时,宣布人事变动. -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000010/15.txt: -------------------------------------------------------------------------------- 1 |   全国25个入围项目 北京考古项目遗憾落选 2 |   十大考古新发现揭晓 3 |   本报记者黄涛报道 经过两天的专家评审,由中国文物报社和中国考古学会主办的“2005年度全国十大考古新发现”昨天晚上7点正式揭晓。25个参与评选的入围项目中,浙江嵊州小黄山遗址、湖南洪江高庙遗址等10个考古项目最终成功入选,北京门头沟东胡林遗址遗憾落选。 4 |   评选已延续16年 5 |   主持此次评选的中国考古学会理事长徐苹芳介绍,十大考古新发现开评至今已经是第16年,此次考古新发现评选从今年1月启动。与去年由各地申报不同的是,今年采取专家根据中国文物报发表资料遴选的办法,由有关专家联合推荐入围项目。 6 |   入围项目的推荐充分考虑学术价值、是否推进学科发展、社会影响、发掘中的 文物保护意识等因素,同时综合时代和区域考古成果等,从2005年1—12月期间国家文物局批准发掘的100余项考古发现中,召集专家会议筛选出24项,涵盖旧 石器时代至宋元时期各个类型的文化遗存。只有 福建东海平潭“碗礁1号”清代沉船遗址是经两位以上专家推荐,直接申请参评的。 7 |   参评须经国家批准 8 |   “在16年的评选中,评选的标准至今没有改变。”徐苹芳介绍说,评选标准总结来说就是“三个价值”和“一个新”。 9 |   参评项目必须是经过国家批准,发掘过程也符合国家的考古发掘规程。而这些考古发现的项目必须在全国范围内具有突出的历史价值、艺术价值和科学价值。而“新”则是指在中国考古学科中增添了新的内容和发现,这些标准缺一不可。 10 |   评委“忍痛割爱” 11 |   此次入选的项目中多数属于年代较远的遗址,徐苹芳解释说,18名评委们并没有“厚古薄今”的意思,完全根据考古的价值来评判。但是由于2005年是中国考古的“丰收年”,参选的项目水平都相当高,因此评委们最终也不得不“忍痛割爱”。 12 |   希望社会关注文保 13 |   在评选过程中,许多参评项目的代表都对记者表示,参加评选是否能最终入选并不是最重要的,而只是希望以此引起社会对文物保护的关注。 14 |   考古专家张忠培表示,随着目前全国建设速度的加快,许多考古项目都是被迫“抢救”发掘出来的。因此,希望以评选的方式推动社会和政府关注文物古迹的保护,为国人留下更多的“遗产”。 15 |   十大考古新发现入选项目 16 |   1.浙江嵊州小黄山遗址 17 |   浙江省文物考古研究所 18 |   2.湖南洪江高庙遗址 19 |   湖南省文物考古研究所 20 |   3.贵州威宁中水遗址 21 |   贵州省文物考古研究所 22 |   4.河南鹤壁刘庄遗址 23 |   河南省文物考古研究所、鹤壁市文物工作队 24 |   5.福建浦城猫耳弄山商代窑群 25 |   福建省文物管理委员会考古队、福建省博物院考古研究所等 26 |   6.山西绛县横水西周墓地 27 |   山西省考古研究所等 28 |   7.陕西韩城梁带村两周遗址 29 |   陕西省考古研究所 30 |   8.江苏句容、金坛周代土墩墓 31 |   南京博物院考古研究所 32 |   9.河南内黄杨庄汉代聚落遗址 33 |   河南省文物考古研究所 34 |   10.山西大同沙岭北魏壁画墓 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000010/16.txt: -------------------------------------------------------------------------------- 1 | 2 |   □本报记者 陆琼琼 3 |   记者昨日从新浪获悉,汪延已经正式辞去CEO一职,曹国伟将接替汪延升任CEO,正式掌舵新浪。短时间内,从CFO到COO,到CEO,曹国伟的工作能力得到多方认可,出任新浪第四任掌门似乎并不出人意外。 4 |   著名网络评论人方兴东认为,对于本来就已经失去灵魂人物的新浪来说,曹国伟的当家很可能会走向一条更稳健、更务实的发展道路。但另有分析人士指出,即使曹国伟的务实作风有益于新浪,如果董事长段永基不离开,新浪仍然难逃厄运。以上分析人士解释说,作为新浪董事长的段永基却把主要精力花在了新浪之外的公司。 5 |   日前传闻中的新浪+TOM模式将弥补新浪无线增值方面的不足。记者从可靠渠道了解到,曹国伟接任CEO后还将继续带领新浪与TOM集团洽谈。“其实双方的谈判没有停止过,只是在有些细节上的分歧致使双方迟迟没有谈成。”该人士透露。 6 |   新浪将在美国当地时间5月9日公布第一季度财报,分析师预计新浪第一季度营收为4590万美元,每股收益为0.15美元,同比下滑25%%。在所有研究新浪股票的分析师中,有五位对新浪的评级为“买入”,有八位的评级为“持有”,有两位的评级为“卖出”。 7 |   新浪5月8日收盘于28.52美元,比上一交易日上涨0.07%%。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000010/17.txt: -------------------------------------------------------------------------------- 1 |   新华社电 美国宇航局官员近日说,宇航局已决定设立一项总奖金为250万美元的大奖赛,希望用这种方式选出未来登陆月球的飞行器设计方案。 2 |   美宇航局副局长戴尔5月5日在加利福尼亚州举行的一次航天会议上说,宇航局已选定“X大奖”基金会管理这项竞赛,宇航局除了出奖金外,也将在未来的月球登陆计划中应用获奖方案。 3 |   这项大奖赛要求参赛者设计出能在月球上飞行、着陆的飞行器原型。“X大奖”基金会说,它将比赛分成两个级别,在地球上模拟月球飞行。第一阶段,参赛飞行器要求从地球上的发射点发射到50米高度,盘旋飞行90秒钟,并在距发射点100米处的指定地点着陆,比赛的第一名将获得35万美元奖金。 4 |   而第二级别的难度高得多。参赛飞行器要求从发射点发射至50米高度,盘旋飞行180秒,并在100米外类似月球表面的一处崎岖地点精确着陆。这项比赛的第一名将获得125万美元的奖金,其方案很可能被宇航局采纳,作为未来登陆月球的飞行器的原型。 5 |   “X大奖”基金会因举办私人设计航天器大奖赛而著名,著名航天设计师伯特·鲁坦设计的“宇宙飞船一号”于2004年成功地飞入亚轨道,成为全世界第一个私人设计建造的航天器,并赢得了1000万美元的“X大奖”。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000010/18.txt: -------------------------------------------------------------------------------- 1 |   日前,据联想相关负责人表示,为了纪念新联想成立一周年,联想在美国市场将ThinkPad T,X以及Z系列笔记本进行一次降价促销活动。 2 |   据了解,此次降价最高达到了800美元,降幅也达到了42%。但联想方面表示,此次降价仅仅是针对该活动,ThinkPad品牌今后的路线仍是以高端为主. -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000010/19.txt: -------------------------------------------------------------------------------- 1 |   科龙德勤案又有新进展:已有多位科龙H股股东到律师处咨询、登记,所涉股份达200余万股。而这些投资者正在为等待提起民事赔偿所需的前置条件焦急等待。 2 |   4月29日,上海新望闻达律师事务所律师宋一欣、秦桢凯在中国证券网上发表了《向境内外科龙H股投资者征集民事赔偿诉讼代理的启事》,全面接受科龙电器流通H股及A股投资者的诉讼及仲裁委托代理事项。宋一欣律师告诉《上海证券报》记者,“《启事》刊登当天,就有H股股东前来咨询登记,由于五一长假,事务所休息,许多H股股东想方设法找到我的电子信箱同我联系。截至今天,已有七八位H股股东前来咨询、登记,所涉及股份己达50余万股,损失金额有待统计。这些H股股东中有境外居民。他们正焦急等待此案前置程序的满足。” 3 |   首位代表科龙股东状告德勤的上海市光明律师事务所南京分所律师涂勇则向记者透露:“多位科龙H股股东前来向我咨询起诉事宜。其中一位就持有150万股科龙H股,持股成本高达300多万元。他非常渴望前置程序能尽快满足,以便诉上公堂。” 4 |   据宋一欣介绍,“根据最高人民法院司法解释的规定,提起虚假陈述民事赔偿诉讼必须满足前置条件,即中国证监会或财政部的行政处罚决定,或有关法院认定有罪并生效的刑事判决书,两者以先出台者为准。” 5 |   “在科龙案中,中国证监会已经对科龙电器与德勤会计师事务所进行了行政处罚前的听证程序,如果没有意外,估计今年上半年内行政处罚决定将出台;而顾雏军编制虚假财务报告罪案已经被广东省佛山市人民检察院立案、即将提起公诉,刑事审判在即。因此,包括H股股东在内的科龙电器权益受损的投资者提起民事赔偿应该不成问题,只是需要等待,万事俱备、只欠东风。”宋一欣进一步解释道。 6 |   谈及此案的被告,宋一欣表示,“科龙电器虚假陈述可涉及很多被告,如科龙电器公司;顾雏军等原董事、高管人员及直接责任人员;存在失职的原监事会成员和独立董事;进行审计的会计师事务所(会计师行)及其承担责任的合伙人、相关注册会计师;由于虚假陈述而获益的关联企业、控股股东等。但主要被告有三,即科龙电器公司、顾雏军、德勤华永会计师事务所(A股股东)或德勤·关黄陈会计师行(H股股东)。” 7 |   宋一欣称,“证券民事赔偿诉讼应当采取目前《民事诉讼法》规定的共同诉讼方式,科龙案也是如此。以共同诉讼提起的原告由于合并后按比例计算诉讼费,故其支出的诉讼费要比单独诉讼提起的原告所支付的诉讼费要少。所以,作为代理律师,从投资者的角度考虑,我需要筹集到一定数量投资者委托后才安排起诉。”(本报记者 岳敬飞 何军) -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000013/10.txt: -------------------------------------------------------------------------------- 1 |   专仿竞争共存 2 |   近日,美国医药保健管理协会(PCMA)的一份评估报告指出,专利药厂家就老年人经常使用的专利药出台了一系列措施,试图限制仿制药厂商产销该类产品,通过诉讼、游说立法和专利成分陷阱等手段,力求最大程度延缓仿制药上市或进入联邦医疗保险体系。 3 |   PCMA代表医药管理公司如医疗保险业的利益。该协会会长MarkMerritt表示,专利药厂家正努力在未来5年内阻止若干仿制药上市,从而换回高达230亿美元的专利药销售额。据该协会的统计,到2010年有大约14支老年人常用药的专利将到期,如果仿制药如期面市,仅通过仿制降胆固醇药舒降之和普拉固、抗抑郁药左洛复、前列腺药保列治就可能为美国联邦医疗保险节约130亿美元。 4 |   代表美国专利药制造商利益的美国药品研究与制造商协会(PhRMA)反驳了Merritt的指责,指出联邦医疗保险预算正在逐年下降,而且仿制药的使用率非常高,处方药中有一半以上是仿制药,证明专利药厂家没有操纵市场,限制仿制药出台。 5 |   代表不同利益的两家行会组织都在表达一个共同的意思就是——专利药厂家和仿制药厂家针锋相对。而实际上,专利药厂家和仿制药厂家私下里也有同盟之时。 6 |   4月24日,美国FDA表示,近期将开展一项市场舞弊行为的调查。FDA指出,专利药厂家和仿制药厂家通过签定赔偿协议,主动延迟仿制药的上市时间,或控制面市药物数量,以商业合同的形式钻法律的空子,使专利药厂家继续获得高额利润,而仿制药企业则从专利药厂家手中获得现金回报。 7 |   专利药和仿制药之间的法律斗争由来已久,专利药厂家和仿制药厂家都逐渐意识到这是一场制药工业的内耗。1999年,诞生了第一份由专利药厂家向仿制药厂家“购买”推迟仿制药物上市承诺的赔偿协议。专利药厂家可以因此维持销售额和利润,仿制药企业一方面可以获得稳定的收入,一方面可借机压缩仿制药领域内竞争对手的市场空间。 8 |   美国联邦贸易委员会披露,去年9月先后有3份赔偿协议生效,之后又至少签订了6份类似的赔偿协议。最近发生的两起判决更是催化了制药企业签订类似协议的热情。 9 |   其中一宗涉及年销售额38亿美元的赛诺菲-安万特公司产品波立维,该产品在美国市场上由百时美施贵宝公司销售。赛诺菲-安万特公司和百时美施贵宝公司与仿制药公司Apotex签定了赔偿协议。根据协议,Apotex公司将所研制的波立维仿制药上市时间延后至2011年,同时得到一笔赔偿金,赔偿金额没有披露。这份协议的签订意味着,美国纳税人还要继续支付高额药费长达5年。第一只仿制药上市将平均导致原专利药价格缩水40%,市场独享期后,其他仿制药上市将使原专利药价格平均再缩水20%~40%。联邦贸易委员会正在考虑如何对这一协议作出反应。另一起协议涉及先灵葆雅公司,联邦贸易委员会已经要求最高法院巡回法庭给予驳回。联邦贸易委员会表示,如果巡回法庭没有驳回该协议,将导致专利药厂家和仿制药厂家随意限制竞争,操纵市场,分享暴利。 10 |   联邦贸易委员会已经向白宫管理与预算办公室提交报告,希望获准对多达200家制药企业发出传票,彻底调查类似的赔偿协议是否触犯了反竞争法。但就目前各制药企业强大的游说力量而言,落实反竞争调查的难度相当大。 11 |   仿制药增长势不可挡 12 |   在未来5年里,仿制药市场的成长趋势不可抵挡。IMS的分析数据显示,在未来5年中,仿制药的销售额将以14%~17%的速度递增,比整个医药行业的销售预期多9%。Bain&Company公司认为,仅2008年就将有价值780亿美元的处方药受到仿制药的冲击,而2005年这个数字为200亿美元。 13 |   仿制药获得发展的另一个原因是政府的青睐。美国联邦医疗保健和医疗补助服务中心(CMMS)降低了2006年的医疗开支预算,从381亿美元减缩至305美元。在经济发展不畅的时候,美国政府格外希望看到更多便宜的仿制药上市,以缓解联邦预算压力。 14 |   这个夏天,辉瑞公司年销售额达33亿美元的抗抑郁畅销药左洛复将失去专利保护,受到仿制药冲击后,年销售额预计为4.7亿美元。仿制药大户泰华公司更愿意自己掌握市场,而不是通过赔偿协议获得利润。泰华美国公司发言人KevinMannix说,泰华公司已经获准第一个推出左洛复的仿制药,泰华公司将有6个月的市场独享期。 15 |   生物制药领域可能成为新的仿制药冲击市场。美国没有批准生物仿制药,但在美国以外生物仿制药有较为显著的发展。 16 |   美国不得不正视生物仿制药市场的前景。首先,生物制药市场庞大,2005年销售总额大约310亿美元,市场空间相当可观。其次,生物制剂复杂程度远高于化学制剂,仿制成本和难度相当高,因而对美国主要生物制药企业的冲击不至于非常严重,也就不会动摇美国在全球的生物领先地位。据统计,生物仿制药的对原药物的价格影响只有10%~20%,而化学制剂则高达80%。此外,如果不及时拓展生物仿制药市场,那么欧洲生物制药行业将快速发展,赶超美国,并通过对美国生物制剂的仿制,分流美国制药企业的利润。 17 |   或成寡头垄断局面 18 |   经过几年的发展,仿制药市场有可能从市场竞争阶段进入寡头垄断阶段。在未来几年出现大量专利药到期的情况下,这一现象有可能加剧。 19 |   咨询公司ThomsonIBES的分析资料显示,泰华公司在未来3~5年中可能保持20%的惊人年收入增幅,2006年的市营率预期为21,接近理想状态的20,而同行业平均市营率是24。泰华公司目前拥有多达160个左右的简化申请新药备案,其中也包括若干生物药物的仿制药报批内容。2006年度,泰华公司有望把持美国仿制药市场20%的份额。泰华公司的目标集中在未来5年内几乎所有制药行业将要失去专利、目前市场价值高达1000亿美元的药物,这些药物的仿制药市场价值至少为200亿美元。 20 |   其他有望成为寡头的仿制药企业中,Andrx公司2006年的市营率预期为24,每股收益增幅预期为19%,销售额预期为11.03亿美元,公司的市场价值为17.5亿美元;Barr公司2006年的市营率预期为19,每股收益增幅预期为16%,销售额预期为12.81亿美元,公司的市场价值为64.47亿美元;Mylan公司2006年的市营率预期为18,每股收益增幅预期为19%,销售额预期为12.46亿美元,公司的市场价值为46.31亿美元;Perrigo公司2006年的市营率预期为22,每股收益增幅预期为10%,销售额预期为14.61亿美元,公司的市场价值为15.55亿美元;华生公司2006年的市营率预期为20,每股收益增幅预期为10%,销售额预期为18.71亿美元,公司的市场价值为30.98亿美元。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000013/11.txt: -------------------------------------------------------------------------------- 1 |   万络给止痛药市场带来的阴霾久久仍未散去,但这丝毫不能说明该市场的需求在减少。在既定的需求现实下,COX-2抑制剂的衰落,必然引来趁虚而入者。不久前我国河南帅克制药和贵州益佰先后宣称将倚靠新的止痛药进入该领域,一场“分羹”之战显然已经急促展开。 2 |   潜力巨大的镇痛药市场一直是跨国公司的天下,而最近它们的优势地位正经受挑战,其缘由是2004年8月份王牌止痛药万络爆出安全性问题引发了市场对新型非甾体止痛药的不信任感。 3 |   去年9月万络自动撤出我国后腾出了巨大的市场空间,引起了众多企业的觊觎,去年5月13日,中美史克曾经发起“霞光行动”,试图从困境中挽救其OTC王牌药芬必得,但更多的国内企业则尽量避开身处安全性危机旋涡中的COX-2抑制剂领域,希望从新的镇痛领域入手找到征战止痛药市场的新武器。 4 |   不久前我国河南帅克制药和贵州益佰先后宣称将倚靠新的止痛药进入这个潜力仅次于感冒药的新领域,据帅克制药董事长张克军透露,帅克开发的止痛新药氨酚曲马多片即将上市。据记者了解,该产品也是今年西安杨森力推的重点产品。而贵州益佰方面则透露,该公司将凭借一种止痛中药来分切国内巨大的止痛药市场。 5 |   显然,一场新的止痛药市场“分羹”大战已经打响。 6 |   止痛药市场依然是金矿 7 |   分析人士指出,尽管目前使用最多的COX-2抑制剂正遭遇安全性危机,但对于整个止痛药并不构成影响,此事件的最大可能是各大类止痛药由此进行一轮市场替代,而与此同时,整个市场还在继续增长。 8 |   中国已经步入老龄化社会,中老年人口约有5亿。风湿和类风湿关节炎、肩周炎、颈椎病、骨质增生等疾病在老年甚至中年人群中属于常见病、多发病,各类疼痛病症患者约占中老年群体的65%,而且这一群体数量还在不断的增加。 9 |   另外,随着我国制造业大国地位的不断提升,产业工人数量急剧膨胀,长期的劳作容易导致各种机体劳损和关节疼痛,因此,该群体已经成为疼痛药物消费的另一个大群体。由于电脑等工具的引入,人们的工作和生活方式已经发生了根本的改变,长期的静坐催生了这一人群各种疼痛的出现,这是导致疼痛人群增长的又一个重要因素。 10 |   据IMS国际咨询公司预测,2005年,全球止痛剂市场总量达800亿美元以上。目前,美国、欧洲和日本是全球最大的止痛药市场,过去30年来止痛药市场销售额一直在稳步上升。国内的资料也显示:我国非处方药市场上止痛药增长迅速,其销售仅次于感冒药,大约占到了20%的比例。 11 |   与此同时,目前医学更加注重病人的生活质量,对患各种疾病引起的疼痛的治疗也催生了新的止痛药市场。以癌症疼痛为例, 12 |   据我国卫生部统计数据显示,20世纪90年代我国肿瘤发病率已上升为127例/10万人。近年来我国每年新增肿瘤患者160万~170万人,死于恶性肿瘤人数达140万人,肿瘤患者总数估计在450万人左右。肿瘤患者中至少有1/3存在着不同程度的疼痛,其中晚期患者占60%~90%。 13 |   市场加速洗牌 14 |   由于止痛药使用领域及其广泛,所以各类药物的使用不能一概而论,但就医院处方板块分析,目前主要有四大类镇痛药,分别为阿片类镇痛药、非甾体类镇痛药、植物类镇痛药以及抗偏头痛制剂。非甾体类镇痛药原本是被寄予了厚望,在万络以及西乐葆等一批新型药物的带动下整个市场发展趋势非常喜人。1998年,全国14个典型城市入网医院的非甾体抗炎药购药金额为9903.3万元,到2002年已经增长至14022.3万元(见表1)。 15 |   不过由于非甾体类镇痛药的安全性问题,其市场有逐渐下滑的趋势,而阿片类药物则有上升的势头,相互市场取代现象比较明显。以使用较多的癌症镇痛为例,在2002~2004年样本医院镇痛类药物使用情况(见表2)中,阿片类镇痛药的市场分额由2002年的62.4%上升到2004年的68.4%。而非甾体类镇痛药的份额却从2002年的34.4%下跌至2004年的29.2%。 16 |   在阿片类镇痛药中,目前主要由曲马多、芬太尼和吗啡3大品种领衔,这三大品种占整个阿片类药品使用金额的70%以上(见附图)。 17 |   芬太尼为人工合成的非衍生物类阿片药片,属于强阿片类镇痛药,WHO将它归入第三阶梯镇痛药,其主要通过激动阿片类受体(μ受体)而发挥镇痛作用,止痛作用为相同剂量吗啡的50~100倍。吗啡主要用于晚期癌症患者第三阶梯止痛。从市场趋势来看,曲马多增长后劲十足,该产品是胺苯环醇类人工合成弱阿片类药物,镇痛强度在同等剂量时,相当于吗啡的1/5,但明显强于其他非类固醇抗炎药,适用于中、重度癌性疼痛,被WHO列为癌痛三阶梯止痛治疗的第二阶梯推荐药物。该药与阿片受体的亲和力比吗啡弱6000倍,基本不存在成瘾性,可以长期使用,因此在治疗剂量下,不产生呼吸抑制,不影响心血管功能,也不产生便秘、排尿困难等不良反应。由于该药的管制相对较松,除可以用于癌症疼痛的治疗外,还可以在骨关节炎、腰椎间盘突出症、肩关节周围炎、创伤、手术后疼痛和骨质疏松症所致的腰腿痛中使用。该类药在医保目录中属乙类药物,目前癌痛临床应用中多为缓释片。 18 |   复合使用药物增长势头明显 19 |   目前镇痛药市场还有一个明显的趋势就是越来越强调联合用药,根据2005年前三季度典型医院用药情况显示,一些复合使用的药物增长势头明显,像氨基比林+安替比林+巴比妥,克痛宁+曲马多+布洛芬,羟考酮+对乙酰氨基酚等。 20 |   张克军也认为,鉴于止痛新药不断遭受安全性问题,复方用药将是镇痛药今后新产品开发的一个重要方向,一些新型的复方产品正显示良好的市场前景,目前选择的重点就是将一些原来在临床使用多年,疗效确切,安全性高的药组合在一起。像最近上市的氨酚曲马多片就是由阿片类和非甾体类使用最久的盐酸曲马多和对乙酰氨基酚组合在一起的复方产品,临床研究证实该药主要用于缓解中度及重度疼痛,起效迅速,镇痛效果明显,无成瘾性,不良反应相比其单方制剂和其他参比制剂明显更低,该产品2001年8月在美国由FDA批准上市。西安杨森在去年将该药引进我国,目前正在力拓市场。鉴于该产品在我国无相关产权保护,河南帅克制药在国内企业中抢先仿制了这个产品。张克军透露,该产品目前已经上市,有望培养成为一个镇痛药的大品种,或许依靠新型复方制剂可以参与重新划分止痛药市场的格局。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000013/12.txt: -------------------------------------------------------------------------------- 1 |   三九医药(000999)和三九生化(000403)今日同时发布公告,三九医药转让三九生化38.11%股权事宜获得国资委批准,三九医药将所持有的三九生化6162.1064万股和1906.0936万股国有法人股分别转让给振兴集团有限公司和山西恒源煤业有限公司。 2 |   协议签订一年后,股权转让终于取得重大进展,也为三九集团的重组工作打下更坚实的基础。但在这一年中,三九生化却发生了大变化。 3 |   根据年报,三九生化2005年度亏损5.21亿元,而2004年亏损额为1.98亿元,同时,每股净资产由2004年的2.55元变为-0.05元,净利润和净资产发生大幅变动。但在双方签订的协议中,收购价格为每股2.55元。 4 |   某券商投行人士认为,由于当时双方所签的协议价格是以2004年的审计报告为依据的,时隔一年,公司的审计结果发生重大变化,如果仍然用2004年的审计结果来进行交易似乎并不合适。 5 |   也有业内人士认为,签订的协议具有法律效力,国资委的批准是协议生效的前提。如今既然已经获准,就应该按照协议的价格执行。 6 |   此前三九生化发布的2005年度报告被审计机构出具了非标意见,14位公司高管也对年报表示质疑。围绕股权转让,相关各方不知是否还会发生争议。但业内人士评价,对公司而言,股权顺利转让,让公司步入正常发展的轨道,这才是最重要的。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000013/13.txt: -------------------------------------------------------------------------------- 1 |   国家食品药品监督管理局南方医药经济研究所主办的首届“中国制药工业百强年会暨第三终端高峰论坛”将于5月15日-17日在成都举行。会议由《医药经济报》、广州标点医药信息有限公司承办。 2 |   据主办方透露,年会将发布2005年医药产业的各项运行数据,包括2005年医药销售领先品种,2005年中药销售领先的企业、化学药销售领先的企业排名等。会上即将发布的制药工业百强排名,其数据采集和分析方法与往年不同。2004年的统计数据分别依照化学制剂生产企业、中成药生产企业、医药商业来统计,2005年则是将那些既有工业生产也有商业经营的企业集团作为一个单位来统计,以便彰显这些“医药巨头”在我国医药产业中的重要地位。 3 |   会议主要议程还包括“2005中国最具影响力药企发布”、“第三终端高峰论坛等”。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000013/14.txt: -------------------------------------------------------------------------------- 1 |   一场史无前例的非典让股骨头坏死走进了人们的视线。据推测,我国每年的股骨头坏死新发病例在15万~20万之间,累积需治疗的病例在500万~750万之间。 2 |   治疗股骨头坏死最理想的方法是保存患者自身股骨头,而达到此目的应早期诊断,早期治疗。 3 |   目前股骨头坏死的早期诊断和治疗的有效方法仍是世界性难题。 4 |   搜狐健康特邀北亚医院肖正权院长做客专家在线访谈间,与网友们谈股骨头坏死治疗方面的问题。 5 |     访谈主题:股骨头坏死 6 |     访谈时间:5月12日15:00-16:00 7 |     访谈地点:搜狐健康专家在线访谈间(地址稍后公布) 8 | <预先提问> 9 |   专家介绍 10 |   院长简介:肖正权        主任医师,医学硕士        出身于著名中医世家,肖氏医学第九代传人,国家指定全国百名名老中医肖贯一教授的学术继承人,尽得其祖父真传。就读于黑龙江省中医药大学,是基础医学院院长李冀导师的硕士研究生。先后从师于世界骨伤联合会副主席、中国中医研究院博士生导师董福慧教授,中国工程院院士博士生导师程莘农教授。北京大学医院院长EMBA毕业。 11 | 12 | 13 | 14 | 肖正权院长 15 |     -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000013/15.txt: -------------------------------------------------------------------------------- 1 |   全国治理医药购销领域商业贿赂专项工作正在轰轰烈烈地展开,却有骗子趁机诈骗医务人员。日前,广东省卫生厅向全省医务人员发出了“谨防有人利用打击商业贿赂诈骗”的提示。 2 |   治理医药购销领域商业贿赂专项工作于3月底在全国拉开帷幕之后,各地卫生行政部门积极贯彻中央精神,部署专项治理工作。近来,广东省许多医务人员突然收到手机短信或者信件,被告知希望其认真自查自纠,将收受的红包和回扣款项主动上缴汇入某个指定账号,争取宽大处理。然而广东省卫生行政部门还没有设立回扣款上缴账户,更没有向医务人员发出过上缴款项的通知。为此,广东省卫生厅向全省的医疗机构和医务人员下发紧急通知,提醒谨防受骗上当。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000013/16.txt: -------------------------------------------------------------------------------- 1 |   深圳一家医院近日与当地银行合作,推出大额医疗“免息分期付款”的服务项目。患者只要在银行办理一张信用卡,在医院就部分项目治疗时可享受分期付款的优待,利息则由院方支付。 2 |   目前享有“免息分期付款”的对象被限定在有稳定经济来源的市民,而且医疗项目较窄。市民认为,大额医疗“免息分期付款”也应向困难市民推广,这样或可解决不能一次交足医疗费患者的一时之急,将付款压力分解,避免延误治疗。 3 |   医院替患者掏利息 4 |   对于在深圳工作不久的张先生来说,虽然每月有近7000元的稳定收入,但由于买房、买车实行的都是按揭贷款,每月的进账在支付银行贷款后虽有节余,但要一次性支付儿子两万多元的近视矫正手术费用,还存在资金不足的困难。 5 |   不过,张先生已经决定在儿子高考结束后,通过“免息分期付款”的方式,在某医院为儿子实行手术。根据医院新近推出的“免息分期付款”医疗服务项目,他只要在银行开个信用卡,银行先替他“埋单”,他今后只要在约定的期限内把银行的钱还上就行。 6 |   据率先在深圳市推出“免息分期付款”医疗服务项目的深圳某民营医院有关负责人介绍,近年来,在他们接诊的患者中,总有一些因为暂时费用问题不得不延缓治疗。因此他们一直在寻找一种能够解决这一问题的办法。当他们把这一想法与深圳市银联沟通时,立即得到了他们的支持,并决定联手推出“免息分期付款”服务。 7 |   仅两项医疗服务可享此待遇 8 |   与其他“按揭消费”不同的是,“免息分期付款”医疗服务手续极为简单,患者的诊疗费用只要在1500元至3万元之间,能支付首期600元的诊疗费,无需进行审批,刷一下约定银行的信用卡就可完成“贷款”过程。 9 |   医院推出的“免息分期付款”服务,近期还暂时限定在眼科的准分子近视矫正手术和口腔科的治疗项目上。该院有关负责人介绍说,这样做除了基于积累经验,为今后推广做准备,并最大限度地控制风险考虑外,主要是考虑到这两个项目的费用相对较高,不能一次性付款者相对较多。 10 |   无稳定收入难享“免息分期付款” 11 |   作为一种新的医疗服务方式,“免息分期付款”一推出就引起部分市民的兴趣,尽管服务项目目前还比较狭窄,市民认为将来完全可以向其他医疗服务项目推广。 12 |   记者了解到,目前能享有该项服务的还只是符合取得信用卡条件的患者。一般要有稳定的收入,收入低、真正困难的市民则因为不符合取得信用卡的条件,其大额手术暂难享此待遇。 13 |   院方表示,这样做主要是避免医院承担收款风险。 14 |   市民建议“穷人”治大病也可“分期付款” 15 |   市民王先生认为,最需要“免息分期付款”服务的是家庭困难而又不幸患大病、急病的患者。现实生活中,医院经常碰到一些本来可以治愈的病人,病治到一半,因为费用问题,只好请求出院回家。对这样的病人,出于对自身经济利益的考虑,大多数医院多采取听之任之的态度。 16 |   由于目前推行“免息分期付款”仅仅是民营医院,其“宣传”的意图还比较明显。希望国有医院也能考虑创新收费方式,真正让困难户也能看得起病。 17 |   王先生建议,医院与银行可以考虑让贫困户提供担保,如房产担保、亲友担保、社会团体担保等方式获得救急款项,再“分期付款”还款。通过这种付款方式,将付款压力分解,避免延误治疗。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000013/17.txt: -------------------------------------------------------------------------------- 1 |   牙防组事件再起风波,此次争议的核心是,口腔用品认证办法的管理对象应该是“保健”品还是“护理”品。 2 |   本报独家获悉,4月24日,中国口腔清洁护理用品工业协会(原牙膏工业协会,下称“牙膏协会”)以书面形式向国家认证认可监督管理委员会(下称“认监委”)递交了一份文件,称如果把牙膏纳入认证,将不利于企业的发展。 3 |   文件陈述了数条理由,诸如牙膏企业的每个产品都必须认证将会影响到生产和销售的效率等等。 4 |   文件还称,即便必须认证,也应该是认证“口腔护理”用品,而不是“口腔保健”用品。 5 |   4月13日,认监委发布了《口腔保健用品认证管理办法(征求意见稿)》。 6 |   自发布之日以来,围绕这两个词的拉锯始终没有停止。而在意见征求期过后,卫生部法规司将根据程序将这个办法发布成为部颁标准。 7 |   “如不采用‘保健’,而采用‘护理’,那么办法将失去意义。”江苏雪豹日化有限公司的董事长童渝于昨日向认监委提交了一份针锋相对的建议。 8 |   据知情人士透露,牙膏协会如此激烈反对的原因是,一旦“保健”认证推行,将会由具备专业团队的相关单位来担当。而牙膏协会属于原轻工系统,缺乏这些资源。 9 |   “所以他们更倾向于用‘护理’一词,可以名正言顺地把认证权纳入自己的管理范畴。” 10 |   相对于强调牙膏功能性的“保健”,“护理”一词在字面的意义更倾向于清洁。前者的主管部门是卫生部门,后者则是牙膏协会。 11 |   有消息人士称,现在已有数百家单位开始申请成为合法的牙膏认证机构。 12 |   “最后的认证机构已经基本成型。”有关人士透露说,这个即将浮出水面的机构与卫生系统下属的全国牙防组有着紧密的“血缘”关系。 13 |   在此之前的牙防组事件中,没有认证资格的全国牙防组违规认证十多年,被北京律师李纲告上法庭。此后,认监委紧急启动认证程序,目前最后的用词尚不明朗。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000013/18.txt: -------------------------------------------------------------------------------- 1 |  中国人为啥没有西方人高? 2 |   饮食人类学家发现,旧石器时代的先祖们茹毛饮血,食肉和生食,身材比我们高大30%左右。今天的西方人,仍然喜欢吃带血丝的肉和生菜色拉,身材也仍旧比吃米面和爱烹调的亚洲人“大一号”。特别是阿尔卑斯山以北的日耳曼民族,分布在德国、荷兰和北欧等地,冬天长,睡眠久,喝鲜奶,食生肉,男人平均身高1.8米以上。其中,荷兰人又酷爱鲜奶和乳制品,人均身高为世界之最。 3 | 4 | 5 | 6 | 7 | 8 |   营养学家发现,谷物和薯类含凝聚素,影响蛋白的吸收和多胺的数量,会使生长缓慢,身材矮小。肉食比素食含有更丰富的营养和性激素原料,生食比熟食含有更多的生长激素原料。人的发育在12岁前主要靠生长激素,12~25岁主要靠性激素。营养和激素水平可以影响当代人身高,持续到四代以后可以显著改变遗传基因。 9 |   在百万年漫长的冬夜里,北欧人世世代代长时间睡眠,分泌了充足的生长激素。同时大量的动物性生食提供了丰富的营养和性激素原料,这使得他们能够昂首全人类。在动物性食品中,牛奶含大量激素,它可以使小牛在数月里长高,也可以帮助乳糖酶充足的小孩在数年内长高。喝奶最多、乳糖酶充足的荷兰人,平均身高成为人类的“珠峰”。 10 |   以下的最佳营养、睡眠和运动方式,会使你的孩子长得高: 11 |   第一、最佳营养。 12 | 13 | 14 | 15 | 16 |   多吃10类食品,包括鱼类、海鲜、海藻、肉类、蛋类、菌类、坚果、种子、蔬菜、水果,有些可生吃;多吃母乳,多喝鲜奶(如果乳糖酶充足),不加热,以保证营养素和激素原料的摄入。 17 |   早、晚是喝奶的最佳时机,早餐时喝奶,给一天的活力提供充分的营养保证;晚上喝牛奶,不但有助于睡眠,而且有助于人体对其营养成份的吸收。最佳营养 18 | 19 | 20 |   据美英两国医学专家研究发现,牛奶中含有两种过去人们未知的催眠物质,其中一种是能够促进睡眠的以血清素合成的色氨酸,由于它的作用,往往只需要一杯牛奶就可以使人入睡;另外一种则是具有类似麻醉镇静作用的天然吗啡类的物质。所以,如果在早晨饮奶,就必然会使人的大脑皮层受到抑制,影响白天的工作和学习。此外,早晨饮奶也不利于消化和吸收,这是因为牛奶的蛋白质要经过胃和小肠的分解形成氨基酸后才能被人体吸收,而早晨空腹状态下,胃、肠的排空是很快的,因此牛奶还来不及消化就被排到了大肠。再有,食物当中被吸收的蛋白质只有在热量充足的基础上才能构成人体组织的一部分,倘若热量不足,吸收的蛋白质就很快变成热量而被消耗掉了,这无疑是一种大材小用的浪费。 21 |   因此营养专家们认为,牛奶最好在傍晚或临睡之前半小时饮用。  喝牛奶应当避误区  牛奶含有丰富的营养,其中不但包括必需氨基酸,还有含量高且易吸收的钙,长期饮用对身体非常有好处。不过,饮用牛奶一定要讲究方式,以下是喝牛奶常见的误区,你一定要注意避免——— 22 |   空腹喝牛奶  空腹饮用牛奶会使肠蠕动增加,牛奶在胃内停留时间缩短,使内部的营养素不能被充分吸收利用。喝牛奶最好与一些淀粉类的食物,如馒头、面包、玉米粥、豆类等同食,有利于消化和吸收。 23 |   食物搭配不当  牛奶不宜与含鞣酸的食物同吃,如浓茶、柿子等,这些食物易与牛奶反应结块成团,影响消化。 24 |   偏爱高度加工的牛奶  高度加工后的牛奶,其营养价值不一定比鲜牛奶好。这是因为经过多次加工后,牛奶中大多加入了微量元素或无机盐,但这些成分并非每个人都需要补充,所以也就不一定适合每一个人。 25 |   第二、睡眠充足。 26 | 27 | 28 | 29 | 30 |   12岁以下睡眠8小时以上,以保证生长激素的分泌。最佳睡眠 31 | 32 |   睡眠或觉醒是正常的生理过程,但它不是人为能完全自主控制的活动,而是一个被动过程。它不像人体某些活动可按人的意志,说来就来,要止则止。失眠的人常常难以诱导师自己进入睡眠而苦恼。其实早期的轻度失眠,经过自我调理的办法就常可得益,具体归纳如下: 33 |   平常而自然的心态。出现失眠不必过分担心,越是紧张,越是强行入睡,结果适得其反。有些人对连续多天出现失眠更是紧张不安,认为这样下去大脑得不到休息,不是短寿,也会生病。这类担心所致的过分焦虑,对睡眠本身及其健康的危害更大。 34 |   寻求并消除失眠的原因。造成失眠的因素颇多,前已提及,只要稍加注意,不难发现。原因消除,失眠自愈,对因疾病引起的失眠症状,要及时求医。不能认为:失眠不过是小问题,算不了病而延误治疗。 35 |   身心松驰,有益睡眠。睡前到户外散步一会儿,放松一下精神,上床前或洗个沐浴,或热水泡脚,然后就寝,对顺利入眠有百利而无一害。诱导人体进入睡眠状态,有许多具体方法,例如:放松功,已在民间流传,可以借助。此外,再介绍两种简而易行之法: 36 |   闭目入静法。上床之后,先合上双眼,然后把眼睛微微张开一条缝,保持与外界有些接触,虽然,精神活动仍在运作,然而,交感神经活动的张力已大大下降,诱导人体渐渐进入睡意蒙胧状态。 37 |   鸣天鼓法。上床后,仰卧闭目,左掌掩左耳,右掌掩右耳,用指头弹击后脑勺,使之听到呼呼的响声。弹击的次数到自觉微累为止。停止弹击后,头慢慢靠近睡枕,两后自然安放于身之两侧,便会很快入睡了。 38 |   睡眠诱导。聆听平淡而有节律的音响,例如:火车运行声、蟋蟀叫、滴水声以及春雨淅沥淅沥声音的磁带,或音乐催眠音带,有助睡眠,还可以此建立诱导睡眠的条件反射。 39 |   饮热牛奶法。睡前饮一杯加糖的热牛奶,据研究表明,能增加人体胰岛素的分泌,增加氨酸进入脑细胞,促使人脑分泌睡眠的血清素;同时牛奶中含有微量吗啡样式物质,具有镇定安神作用,从而促使人体安稳入睡。 40 |   合适的睡姿。睡眠姿势当然以舒适为宜,且可因人而异。但睡眠以侧卧为佳,养生家曹慈山在《睡诀》中指出:“左侧卧屈左足,屈左臂,以手上承头,伸右足,以右手置于右股间。右侧卧位反是。”这种睡眠姿势有利于全身放松,睡得安稳。 41 |   若疲劳而难以入睡者,不妨食用苹果、香蕉、橘、橙、梨等一类水果。因为,这类水果的芳香味,对神经系统有镇静作用;水果中的糖分,能使大脑皮质抑制而易进入睡眠状态。 42 |   若因出差在外,不适应环境而致失眠时,应先有思想准备,主动调适,有备无患,不致因紧张担心睡不好。同时还可采用以上助眠之法,则可避免失眠。最佳运动 43 | 44 |   第三、足量运动。 45 | 46 | 47 | 48 | 49 |   尽量在户外,每天运动几个小时以上,以增加各种营养物质,包括维生素D、钙和“太阳能”的形成和吸收,促进骨骼和肌肉的快速生长。 50 |   身高能否如意,取决于几个因素,首先是遗传因素,占70%,此外,取决于其他条件,包括运动、营养、环境和社会因素等。为了让孩子长得更高一点,家长应注意以下几点:  一、莫错过生长快速期  在儿童少年青春发育过程中,何时身高长得最快呢?研究证实,绝大多数中国汉族儿童的身高突增高峰为女童12岁左右、男童14岁左右;90%以上女童身高增长最快的年龄在11~13岁之间,男童为13~15岁之间。为了让孩子长得高一些,家长尤其应注意孩子在生长快速期的营养、运动等问题。}   二、应注重营养补充  营养是儿童体格生长的关键。体格正常生长所需的能量、蛋白质和氨基酸,必须由食物供给,主要是肉、蛋、豆及豆类食物。骨的形成还需要足够量的钙、磷及微量的锰和铁。钙的摄入不足及维生素D缺乏时,会造成骨矿化不足,维生素A缺乏会使骨变短变厚,维生素C缺乏会使骨细胞间质形成缺陷而变脆,这些都会影响骨的生长。   目前一般家庭在有荤有素的饮食中,营养应该是全面及足量的,家长应该注意不要让孩子养成偏食的习惯,更不要让孩子过多地吃零食而影响重要营养物质的摄入。  三、莫忽视运动锻炼  体育运动可加强机体新陈代谢过程,加速血液循环,促进生长激素分泌,加快骨组织生长,有益于人体长高。以下几种运动对增高有一定效果,不妨一试。  1. -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000013/19.txt: -------------------------------------------------------------------------------- 1 |   9日在京举行的世界卫生组织慢性病全球报告中文版首发式上,卫生部公布了中国慢性病情况。其中一个令人瞠目的数字是,目前全国约有3.5亿吸烟者,2000年由吸烟导致的死亡人数近100万人,超过艾滋病、结核、交通事故以及自杀死亡人数的总和,占全部死亡人数的12%。 2 |   卫生部警告说,如不采取控制措施,预计到2020年时这个比例将上升至33%,死亡人数将达到200万人,其中有一半人将在35-64岁之间死亡。 3 |   2002年我国男性吸烟率为66.0%,女性吸烟率为3.08%,与1996年比,尽管吸烟率略有下降,随着总人口的增加,吸烟人数仍然增加了3000万人。 4 |   吸烟对青年十分有害,因此,应尽早戒烟。戒烟方法很多,下面十二种戒烟法,可供少年吸烟者试一试:  (1)特意在一二天内超量吸烟(每天吸两包左右),使人体对香烟的味道产生反感,从而戒烟;或在患伤风感冒没有吸烟欲望时戒烟。  (2)想象自己在吸烟,同时想象令人作呕的事情(比如你手中烟盒或香烟上有痰渍等等)。  (3)将戒烟的原因写在纸上,经常阅读;如能可能,尽量补充新内容。  (4)将想购买的物品写下来,按其价格计算可购买香烟的包数。逐日将用来购买香烟的钱储存在“聚宝盆”内。每过一个月,清点一次钱数。  (5)同朋友打“赌”,保证戒烟。当然这要用自己的烟钱作为 “赌注”。  (6)不整条买烟。 5 |     相关事件: 6 |     卫生部:我国青少年吸烟人数高达5000万 7 |     9日在京举行的世界卫生组织慢性病全球报告中文版首发式上,卫生部公布的中国慢性病情况表明,目前中国青少年吸烟人数高达5000万人。>>>全文 8 |     与潜意识对话 临床催眠治疗能帮助戒烟 9 |     美国科学家最近经研究发现,在正规的临床催眠师帮助下接受催眠治疗,有可能帮助吸烟者成功戒烟且长时间保持戒烟状态。>>>全文 10 |     生活习惯影响烟瘾 晚睡早起的人烟瘾更大 11 |     据最新一期《国际生物钟学》期刊研究显示,德国科学家发现,早晨起床时间在5点之前、晚上11点之后睡觉的人更容易吸烟!>>>全文 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000014/10.txt: -------------------------------------------------------------------------------- 1 |  足彩06032期王智意甲解盘 2 |   1.卡利亚里VS国际米兰:杯赛对国米的吸引力更大,目前平赔较低,本场在“0”的基础上需适当补“1”。 3 |   2.切沃VS佛罗伦萨:主队近来状态出现下滑,客队为冠军杯名额则到了不容有失的阶段,然而澳彩却为本场开出主队低水的平手初盘,看来“紫百合”是不会轻松拿到3分。 4 |   3.恩波利VS阿斯科利:庄家仅为主场5连胜的恩波利开出平半浅盘,分明是对该队取胜信心不足的表现。 5 |   4.拉齐奥VS帕尔马:主队在球半盘下的赢盘能力并不突出,而且初盘存在刻意看低帕尔马的嫌疑,本场补“1”稳妥。 6 |   5.AC米兰VS罗马:米兰很少在对手身上发生连续输盘的事情,首回合米兰输盘,本场可对他们看高半线。 7 |   6.帕勒莫VS梅西纳:此战已经无关紧要,初盘显示本场是“3/1”格局。 8 |   7.雷吉纳VS尤文图斯:初盘显示了客队的强大,且本场关系到客队夺冠问题,此时尤文图斯可任胆选。 9 |   8.特雷维索VS乌迪内斯:乌迪内斯在客场已连续拿下3盘,在状态正佳的时候,澳彩只为其开出平手初盘,想必“乌鸡”的势头会就此中断。足彩06032期王智德甲解盘 10 |   9.科隆VS比勒菲尔德:初盘高开意图明显,庄家引筹码去上盘的嫌疑极大,本场科隆有望不败。 11 |   10.拜仁慕尼黑VS多特蒙德:多特蒙德客场至多连赢两盘,本场已到其盘路极限,而且澳彩初盘也有意在冷落主队。 12 |   11.汉堡VS不莱梅:半球盘下两队在本赛季尚无平局记录,本场适合选择“3/0”。 13 |   12.杜伊斯堡VS美因兹:初盘与欧赔极为不符,庄家有利用主队已经降级的题材诱下美因兹的嫌疑。 14 |   13.沙尔克04VS斯图加特:初盘主队水位偏高,目前斯图加特客场盘路有反弹迹象,本场不排除客队抢分可能。 15 |   14.沃尔夫斯堡VS凯泽斯劳滕:命悬一线的战役,庄家为本场开出了较高的平局赔率,想必两队有望分出胜负。 16 |   栏目心水(256元) 17 |   0 03 1 31 3 31 31 1 3 3 30 3 30 30 18 |   栏目心水(2048元) 19 |   01 10 1 31 30 31 31 1 3 3 30 31 31 302  -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000014/11.txt: -------------------------------------------------------------------------------- 1 |   这是一次跨越世纪的重逢,这是一次弥补历史的棋坛盛事。5月23日至27日,在美丽的沈阳世博园,来自中国、日本和韩国三国的九位当年叱咤世界棋坛的围棋元老,将上演一次对决。昨天,本次元老赛的参赛者之一、中国围棋协会主席陈祖德表示,他对即将在沈阳揭幕的2006年中、日、韩三国围棋元老赛非常期待:“这是一次弥补历史的比赛!”  三国元老首次聚首  本次三国元老赛由国家体育总局棋牌运动管理中心、中国围棋协会主办、由沈阳市体育局、沈阳市体育总会、沈阳晚报、沈阳市围棋协会、沈阳电视台协办。比赛地点设在沈阳世界园艺博览会,是2006年沈阳市承办的级别最高的比赛,也是2006年国内外广泛关注的重要体育赛事之一。  参加比赛的中日韩围棋元老都是二十世纪世界最著名的围棋代表人物,他们分别是中国队的陈祖德、王汝南和聂卫平;日本队的林海峰、宫本直毅和羽根泰正;韩国队的金寅、河灿锡和尹琦铉。除了中国的三位元老赫赫有名外,日本的林海峰是一代围棋巨人吴清源的弟子,曾三连霸名人战,五获本因坊,被日本《棋道》杂志敬称为棋界“阿信”;宫本直毅九段师从于关西棋院创始人桥本宇太郎九段,他在1974年率团访华,对聂卫平一生的命运发挥过至关重要的影响。中国棋迷相对陌生的金寅更是韩国著名的超一流九段棋手。相当于韩国的“陈祖德”,从1965年开始,韩国进入了名副其实的“金寅时代”,曾影响韩国围棋界十多年,七十年代后期,由于曹薰铉、徐奉洙等新人的崛起,金寅渐渐地退出了棋战的第一线。但正是他将韩国围棋引上了现代之路。陈祖德:这是弥补历史的比赛  中国围棋协会主席、原中国棋院院长陈祖德先生,昨天在接受本报记者采访时对这次比赛给予了很高的评价,“这是世界第一次!”陈老说,“以前我们只是分别搞过中日和中韩的元老比赛,我们这批三个国家的棋手聚会还是第一次,因此这次比赛让人感到很兴奋。”  陈祖德介绍说,因为各种历史原因,他和那个时代的韩日两国的高手们在各自棋力达到顶峰的时候没有交过手,这可以算是一个历史的遗憾,而这次三国元老赛正是弥补了他那个时代的选手的一个遗憾,填补世界围棋的一次历史空白,同时也将对中国围棋产生深远的影响。  当陈祖德听说比赛要在美丽的沈阳世博园举行时,显得非常的高兴:“那太好了,我早就听说那里非常美,我想在那里比赛将是一次享受!这次聚会太令人期待了!”  世博园将书写世界围棋佳话  美丽的沈阳世博园已迎来八方游客,而这次九位中日韩围棋元老的跨世纪聚会,将为这美丽的地方书写一段佳话。据了解,本次比赛将在25和26日两天举行交叉比赛,到时候,当年未能一决雌雄的围棋元老们将亮出各自的绝活,留下一个个经典的对局。  棋盘山,流传着传说与故事,凝聚着历史与现实融合的美丽,这里,将迎来一代宗师们的笑语;世博园,汇聚着鲜花与绿草,传递着人与自然和谐共生的理念,这里,还将留下世界围棋的一段佳话……   -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000014/12.txt: -------------------------------------------------------------------------------- 1 | 2 |   皇帝“金口”吓走奇才 3 |   詹姆斯绝对全能,能突破、能投篮、能运球、能传球,还能……用嘴赢得比赛。在骑士队114比113战胜奇才队以总比分4比2晋级东区半决赛的比赛中,詹姆斯就施展了一回他的嘴上功夫,仅只言片语就说得阿里纳斯罚输了比赛。刚刚在联盟里混了三年的詹姆斯,已经开始向伯德、米勒等“口技”出众的老前辈看齐了。 4 |   现场 一张嘴战败一双手 5 |   阿里纳斯有一双投手的手,这双手可以让他投中三分线两米开外的三分球,可以让他在对骑士队的生死大战上独得36分。然而阿里纳斯没有想到,当这双可以把罚球命中率控制在80%以上的手遭遇詹姆斯宽而厚的双唇时,竟然抖得连一个球也罚不进。 6 |   是阿里纳斯的手葬送了奇才队,还是从詹姆斯唇间吐出的只言片语成就了骑士? 7 |   一切应该从比赛最后两秒说起。当时,得到球的阿里纳斯没有选择地在三分线两米开外起跳投篮。球出手后,阿里纳斯的双眼一直盯着皮球在空中飞行的轨迹,当球进筐的一刹那,阿里纳斯几乎和全场观众的惊呼声同步举起双手。这是他对这双手的感谢,是它们让奇才队出现了一丝生的希望。或许,当时的阿里纳斯已经开始认为胜利女神在这一天是站在他们这边的。 8 |   可一切并不顺利,阿里纳斯的最后一投好像耗尽了他的神奇。在加时赛里,骑士队的防守让他一分未得。直到比赛还剩15秒,休斯对阿里纳斯犯规,后者才获得了两次轻易得分的罚球机会。而这时,奇才队领先一分。 9 |   本赛季罚球命中率高达82%的阿里纳斯走上了罚球线,在习惯性的将球绕身三周之后,他的第一罚并没有罚中。手感还没有恢复,阿里纳斯深吸了一口气。 10 |   就在这时,詹姆斯走到阿里纳斯身边,拍着对方的胸口,低着头轻轻地说道:“如果你连第二罚也错失了,你知道谁会来终结比赛。”在之前第三场和第五场的较量中,骑士队均以一分优势险胜,而且都是由詹姆斯在最后时刻强攻上篮投中制胜球。 11 |   阿里纳斯的表情变得很凝重,而他的罚篮准备动作也发生了改变。他第二次罚球前,并没有在腰间绕球,而是直接罚篮。这是平时的阿里纳斯绝不会做的事情。阿里纳斯心急了,方寸大乱!结果,第二罚球偏得比第一罚时还离谱。骑士队反攻的机会来了。 12 |   战术 皇帝发话 小兵下手 13 |   詹姆斯真的履行了对阿里纳斯的“诺言”,在接下来的进攻中对奇才队进行了绝杀吗?没有。完成绝杀的是阿里纳斯根本想不到的达蒙·琼斯。应该说,詹姆斯的话完全是一次攻心战术。 14 |   在阿里纳斯罚失两球后,骑士队随即叫了暂停。主帅布朗布置了他这场比赛的最后一个战术:詹姆斯主攻,休斯接应,如果休斯还没有机会,球就交给琼斯投。 15 |   比赛再次开始,詹姆斯一接到球,阿里纳斯和丹尼尔斯马上跟出三分线,对詹姆斯进行包夹,奇才队显然不希望再重蹈前几场的覆辙,因此立刻对其采取包夹战术。已经知道如何应对的“小皇帝”将球传给休斯,而在一旁防守琼斯的巴特勒立刻选择了放弃对琼斯的防守,去盯防休斯。而此时琼斯在底线无人防守,休斯立即传球,琼斯一击命中。 16 |    17 | “很显然,胜利女神今晚并没有站在我们这边。你能想象吗?一个罚球命中率在80%的投手,在最后时刻竟然两罚不中。我只能说,今晚太糟糕了。”比赛已经结束,阿里纳斯还在想着刚才发生的事情。 18 |   历史 “邮差周日不送信” 19 |   詹姆斯并不是第一个使用攻心战术帮助球队获胜的人。这其中最经典的莫过于原公牛队著名球星皮蓬对马龙说的那句“邮差周日不送信”,简直就是詹姆斯对阿里纳斯的翻版。 20 |   1996-97赛季公牛与爵士总决赛第六场,那是一个星期天。两支球队杀得难解难分,终场前35秒战成82比82平。马龙在最后关头获得罚球机会,但站在一边的皮蓬对绰号“邮差”的马龙说:“星期天邮差不送信。”一句话让马龙“心惊胆战”,结果终场前9.2秒居然两次关键罚球砸筐而出。 21 |   而此后“飞人”乔丹在下一回合进攻时,一个胯下运球,突然急停并向后撤步,一记稳稳的跳投随着终场哨响飞入篮筐,公牛队84比82两分险胜。这一球也是近20年来NBA总决赛中惟一一个真正的压哨绝杀球。 22 |   “口技大师” 各有绝活 23 |   用言语干扰对手心态,从精神上击败对手的情况在NBA的赛场上很普遍,包括伯德、乔丹、米勒在内的一批天皇巨星都会利用这招来打击对手的自信心。然而每位巨星运用“口技”的特点却各不相同。 24 |   伯德 先知型 25 |   伯德喜欢对某个事件进行“预测”,再把他“预测”的结果告诉对手,最后用自己的实力将他的“预言”实现。 26 |   “我要在这里进三分送你们回家。”——伯德在一场比赛的最后一次进攻前指着三分线外的一块地板对对手说,当时拥有进攻权的凯尔特人队与对手平分。结果界外球开出后,伯德真的在那里接球投进压哨三分,赢下比赛。 27 |   “你们决定谁要拿第二名了吗?”——1986年全明星三分球大赛前,伯德一进休息室就问所有参赛者。伯德最终夺得了那届三分大赛的冠军。 28 |   乔丹 显摆型 29 |   乔丹喜欢向所有人炫耀自己的超人实力,因此,使用“口技”也就变成了他向对手显摆的工具。在他使用这招时,完全是一副上帝对凡人训诫的模样。 30 |   “你投呀,我让你投……投呀!”——乔丹在防守时最常说的话,通常情况下对手都会投篮不中。 31 |   “加油,你差点就守住我了。”——乔丹在进攻得手之后最常说的话。 32 |   姚明 33 | 努力型 34 |   别以为母语是汉语的姚明不会使用“口技”。在NBA征战了三个赛季的姚明融入NBA是全方位的,在口技方面虽然不比之前几位大师,但也有上乘之作。 35 |   “我要打得你把护齿都吞下去。”——2005年2月10日,在火箭队105比92战胜公牛队的比赛中,姚明对公牛队中锋钱德勒说。在说完这句话后,姚明在对手头上连得6分。是役,他10投9中砍下21分。 36 |   “口技对决”米勒太嫩 37 |   使用“口技”攻击对手,并不是百分之百能成功的。在NBA的历史中,经常使用“口技”的雷杰·米勒就碰到过使用“口技”得到反效果的事情,因为他攻击的对象是心理素质超强且更擅长“口技”的伯德。 38 |   在米勒的新秀赛季,年轻的米勒在步行者队的主场第一次碰到伯德。当时步行者队落后两分,伯德获得罚球机会。米勒随即向伯德发出“嘿!嘿!”的干扰声。“你没开玩笑吧,菜鸟?”伯德对米勒说,然后从容地罚进一球。当伯德再次得到球时,他又说:“菜鸟,我告诉你,我是现在联盟里最顶尖的投手,全NBA!知道吗?你还有什么想说的吗?”接着,伯德又罚进一球。“我当时真是蠢到十八层地狱去了。”米勒在自己的回忆录中提到这段往事时,评价自己当时的表现说。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000014/13.txt: -------------------------------------------------------------------------------- 1 | 2 |   有江湖的地方,就有恩怨。一个远离辽足视线很久的人物———马林,突然和三轮不胜的辽足扯上了关系。“下岗的马林接替战绩不佳的唐尧东?”一件原本也许是捕风捉影的事,引来当事人完全不同的反应:马林一笑置之,唐尧东则咆哮如雷。而辽宁队队长肇俊哲则说:“辽宁队现在遇到很多困难,希望外界的炒作不要再给辽足添乱了。” 3 |   马林笑言:我下岗还能给别人造成威胁? 4 |   昨天下午,马林刚办理完辞去中甲江苏舜天俱乐部主教练一职的后续事务,由南京飞回大连,被几个好友拉着接风,正推杯换盏之际,一则辽足主帅的消息却让他哑然失笑。 5 |   昨日一则报道称,辽宁队近期战绩不佳,逼近降级区,如果辽宁队持续不胜,俱乐部将考虑换帅,而辽足旧帅马林,刚刚从江苏下岗,又有张曙光和辽宁队队员的支持,极有可能接替唐尧东。而在今年年初的辽足主帅竞聘时,马林恰恰是唐尧东的竞争对手。 6 |   “我刚刚从南京回来,刚下飞机,如果你不说,我还不知道这事。”马林似乎无事一身轻,还陶醉在与舜天“甜蜜”的分手中,“舜天集团董事长、俱乐部老总对我的工作都给予了肯定,通过几个月的相处,我们相互了解,彼此信任支持,我走的时候,俱乐部老总特地送到机场,我们还抹了眼泪。” 7 |   不在其位,不谋其政。马林说他对辽宁队的感情从来都是割舍不下,但在带舜天期间,他只关注自己队伍和对手的情况,对辽宁队的情况一无所知,毕竟是两个级别的联赛,现在他又刚刚下岗,正想休息几天。至于将来的事,他也不好说。 8 |   唐尧东咆哮:谁能带好辽宁队你就找谁去! 9 |   记者昨日连线唐尧东时,原本是想请他介绍一下辽宁队今日主场迎战西安国际的备战情况,国际上轮战胜实德后,士气正旺,欲在辽宁主场取得两连胜。不料唐尧东没好气地说:“这怎么能说,这是机密。我都说了,明天的比赛还怎么打。” 10 |   记者随后问到唐指导是否感受到压力,有媒体称俱乐部正在酝酿换帅,当听到马林这个名字时,唐尧东顿时怒了:“谁能带好辽宁队你就找谁去,这事你找我干吗。”记者请其心平气和一些,还未等记者说完,唐尧东极其严肃地把话一字字蹦道:“我———挂———电———话———了。” 11 |   辽足俱乐部董事长陈加松正在北京商谈招商事宜,在被问到换帅的问题上时,陈加松表示到目前为止还没有考虑过,而张曙光的电话则一直无人接听。 12 |   队长肇俊哲:外界声音导致辽足不团结更可怕 13 |   小肇在谈到今天对国际的比赛时,表示力争3分,国际虽然赢了实德,但毕竟是在辽足主场,辽宁队定当全力以赴。在谈到换帅的传闻时,小肇十分反感:“辽宁队输球并不可怕,外部的声音导致辽宁队内部不团结才更可怕。” 14 |   小肇说:“在辽宁队最困难的时候,全队上下都在尽力打好每一场比赛,希望外界的炒作不要给辽宁队添乱了。唐导非常不容易,队里人手本来就缺,再加上伤病,上轮客场输给天津,也是实力摆在那儿。输球是大家的责任,不能让一个人背。当然,作为教练,责任会更大些,压力也大。现在全队上下都十分支持唐导,我们现在最需要的就是团结一致,共渡难关。” 15 |   小肇最后说道:“谁都不容易,大家互相理解吧!” 16 |   本报记者黄进报道 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000014/14.txt: -------------------------------------------------------------------------------- 1 |   北京、莫斯科、美国 三次看升旗感受不同  大郅:北京这次最难忘  《体育天地·mvp》记者朱冲报道  “起来,不愿做奴隶的人们……”5月8日凌晨5点,王治郅随中国男篮一起在天安门广场参加了升旗仪式。当国歌响起的时候,王治郅两眼紧盯五星红旗,轻声唱着国歌。这是王治郅四年以来第一次在自己祖国的土地上听到国歌响起,看到国旗升起。所以,王治郅说:“这是我最难忘的一次看升旗。”  国旗让我感到责任  在谈到升旗的感受时,王治郅说:“所有热爱祖国的人在看到五星红旗冉冉升起的时候都会有同一种感受,那就是作为一名中国人的骄傲和自豪。我一共在天安门广场参加过两次升旗,第一次是上初中的时候,虽然时间过去十几年了,但这种感情是不变的,而且只会继续加深。”  的确,这一次升旗对于王治郅来说很特别,因为这是他在经历了“滞美不归”事件之后第一次看到升旗,这是他四年以来第一次回到自己的祖国看到升旗。“四年来祖国的发展日新月异,升旗的时候,我脑子里想了很多,浮现了很多场景。我想起了回国后我父母带我逛漂亮的四环、五环路,想起了看到的雄伟建筑,想起了随处可见的‘新北京、新奥运、同一个世界、同一个梦想’的宣传牌。”王治郅严肃地说,“当时我就感受到一种责任,我希望在2008年的北京奥运会上站在领奖台上再次看到国旗升起,听到国歌响起。”  在莫斯科看升旗很激动  说到北京奥运会,王治郅又自然而然地想起了2001年7月13日的莫斯科,北京申奥现场。当时,王治郅是申奥的形象大使。  “作为北京申奥代表团的成员,当我在莫斯科亲眼看到萨马兰奇宣布北京获胜的那个时刻,我真的感到心潮澎湃。”王治郅说,“在申奥现场没有升旗仪式,没有奏国歌,但当宣布我们获胜的时候,我们全部拿出了早就准备好的国旗。等回到大使馆,看到国旗升起、国歌响起的时候我们所有人都感到无比的激动和自豪。”  看到姚明就能看到国旗  除了奥运会以外,这次升旗还让王治郅想起了他在美国的生活。在美国的四年是大郅最为孤独的经历,也是最想念祖国的时候。“在美国,只有到中国大使馆去才能看到国旗,听到国歌。”王治郅说。  当王治郅还在NBA时,他和姚明在赛场上的每一次相遇都被称为移动长城的对接。“我记得,无论我遇到姚明还是巴特尔,球馆里都会有很多华人球迷来加油,看台上也会看到国旗,那时候我们就感到一种身处国外的民族自豪感。”王治郅说,“但我和姚明在场上的相遇机会很少,更多的只能是在场下匆匆聊几句,所以我特别能理解姚明所说的,在NBA就感到中国人太少,我真的希望看到越来越多的中国人能够出现在世界最高水平的联盟中证明我们中国人的实力。所以对于姚明成为状元秀,对于姚明在NBA取得的成就和成功,我由衷地替他感到高兴,这是所有中国人的骄傲。” -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000014/15.txt: -------------------------------------------------------------------------------- 1 | 2 | 3 |   本期足彩做为意德联赛的收官之战,仍保留了三大悬念,即意甲的冠军归属、欧冠资格之争及德甲的最后一场保级大战。相信很多理性彩民也会在选择上不敢轻易来把这三场比赛做稳胆来选择。下面,本人就本期足彩做以剖析,仅供大家参考。 4 |   随着五大联赛即将全面结束,有四国联赛已经提前产生了本国联赛冠军,本周末的尤文图斯和AC米兰将把这个悬念留到最后。首先分析一下对阵形势:主场王A米对阵的球队是对欧冠联赛虎视眈眈的“红狼”罗马,而客场王尤文将对阵早已安全上岸的自己的嫡系雷吉纳队,尤文更有三分领先优势。不考虑联赛冠军,A米也不可能允许自己一年内两次栽倒在“红狼“脚下,而尤文则更不会允许小弟坏了自己的夺冠美梦。可以说,两队绝对不允许自己有任何失误。“红狼”的奇迹要看竞争死敌佛罗伦萨败或平切沃,而自己则必须战胜A米才能搭上欧冠末班车,当然,这种理论上的可能会使任何人产生幻想。但要记住,这场比赛是“红狼”客场与国米死拼意大利杯后的第三天进行,夺杯与否的心理及体力将直接影响它的发挥。综合种种数据表明,A米将有95%的可能在圣罗西球场击败罗马(尽管有消息说罗马王子托蒂将复出登场)。而尤文将最可能在雷吉纳象征性的进攻下如愿以一个小比分顺利拿下,最大的奇迹则是尤文以一分的优势顺利夺冠。 5 |   第二悬念是佛罗伦萨和罗马的冠军联赛资格之争。本赛季佛罗伦萨在重金投入下终于有了最好的回报,在“重炮”托尼的率领下,主客场发挥极为稳定,积分始终处于前列,而能够跻身冠军联赛是其队上下的最大目标,此翻客场挑战“飞驴”切沃,是其能否保住联赛第四的关键之战。但佛罗伦萨面对的对手是已经踏入联盟杯赛场的已经没有任何追求的切沃,这一战就看切沃的战意了,但不论怎样,指望罗马客场翻盘A米的希望毕竟不是很大。所以,无论佛罗伦萨输赢,其出现的机会还是最大的,以切沃的特点,又鉴于其客场曾输给过切沃,似乎好象不会轻易让佛罗伦萨过关的,但最大的可能是各取一分,互不伤了和气。不过指望佛罗伦萨客场战胜切沃似乎不大可能。 6 |   第三悬念是相差一分的沃尔夫斯堡和凯泽谁能最后保级成功。这两支昔日的德甲油条终于在本轮迎来了决定命运的生死大战。本赛季“狼堡”主场的防守一直处于德甲的榜眼位置,进攻则处在榜尾。昔日顾头不顾尾的毛病终于以只加强防守不会进攻换取到了濒临降级的厄运。本赛季凯泽主场轻松拿下“狼堡”,但这回客场作战,尽管达到了只许胜不许输的境地,但面对整个赛季主场只失了十四个球的“狼堡”,恐怕再次取胜的可能性几乎就不存在了。生死一线间,决定命运的比赛,“狼堡”人是不会把优势转化为劣势的。如果凯泽选择狂轰乱炸式的进攻,或许输的更惨,本人估计,最有可能的结果是:战平占60%,“狼堡”胜40%。 7 |   其它场次比赛,要侧重于赛季最后一个主场为基准,注意已掉级的几支球队可能会打出取悦球迷的进功足球,意甲倾向于二到三场平局,德甲几支强队之战主要考虑各参加世界杯国球员的战意。估计本期足彩奖金会有一定程度的提高。 8 |   本人心水: 9 |   1:31 10 |   2:1 11 |   3:31 12 |   4:3 13 |   5:3 14 |   6:3 15 |   7:10 16 |   8:30 17 |   9:3 18 |   10:31 19 |   11:30 20 |   12:30 21 |   13:3 22 |   14:31 23 |    24 | -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000014/16.txt: -------------------------------------------------------------------------------- 1 | 2 |   刚刚在上周六以0比2惨败在长春队脚下的沈足,今天下午将在客场挑战升班马厦门蓝狮,尽管在此前,沈足曾在换帅之后创造了三连胜和四轮不败的骄人战绩,但随着上一轮主场失利,使得沈足刚刚赢来的保级优势顿时化为乌有,对此,沈足俱乐部总经理何兵表示:“过去的胜利已经成为过去,我们现在必须要冷静地面对现实,从现在开始,我们打的每一场比赛都是保级战,特别是跟厦门这样的保级球队作战,我们更是要全力争胜。” 3 |   为了提前适应厦门当地的天气和场地,沈足在本周一就抵达厦门,开始了赛前备战,尽管在上一轮遭遇惨败,但沈足将士却并没有因此灰心丧气,相反,随着许博、普科两名绝对主力的回归,全队对本轮挑战厦门蓝狮充满了必胜的信心,场上队长汪强告诉记者:“我们上一轮输给长春其实很正常,一方面我们缺少了两名主力队员,另一方面今年长春队非常强,他们现在排名第二就足以说明他们非常有实力。不过,本轮和厦门队比赛,我们还是非常有信心拿下来,今年厦门队的实力并不是很强,虽然客场比赛有些困难,但我们全队的目标非常明确,就是全取3分,最坏也要带着1分回来。” 4 |   许博和普科的回归也令主教练库夫曼感到非常高兴,因为他又可以派出他最满意的主力阵容出战。对于今天的比赛,库夫曼表示:“厦门队已经几轮没有赢球了,我想他们对这场比赛也会虎视眈眈,但中国有句俗话是狭路相逢勇者胜,到时候就看我们谁更顽强吧。” 5 |   本报记者刘淼报道 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000014/17.txt: -------------------------------------------------------------------------------- 1 | 2 |   中新网5月10日电今日出版的辽沈晚报刊载了中国球员李铁从英国利物浦发回来的文章,详细阐述了他和老东家埃弗顿队解约的内幕。文章全文如下: 3 |   今天我必须要在这里纠正一个概念上的错误。国内媒体昨天都用了“埃弗顿与李铁解约”这样的标题来报道我的留洋现状,其实这个说法是不正确的。 4 |   我与埃弗顿队的工作合同在今年6月30日正式到期,埃弗顿目前只是初步决定“不再与我续约”,这与“解约”完全是两个概念。其实,我将离开埃弗顿早已经不是什么秘密,否则我也不会主动与其他一些球会进行积极的接触。最近两年,我因为伤病的原因一直没有替埃弗顿打过比赛,埃弗顿也在去年买进了大批前卫队员,人员储备方面显得很充足,所以可能教练感觉不再需要我了。 5 |   这是再正常不过的游戏规则了,我非常理解埃弗顿的想法。事实上,是我主动找到埃弗顿决策层,先表明去意的。与我一起与俱乐部谈过话的还有邓肯·弗格森,他是因为年龄实在太大,明年就36岁了,没办法适应埃弗顿激烈的竞争,这才心生离意。而我,则是希望能换个地方得到新的发展机会。 6 |   “不再续约埃弗顿”意味着我从7月份开始就成为自由球员,实际上这对我寻找新工作是非常有利的一个筹码,毕竟能不花一分钱就能得到一个身价100多万英镑的球员,对任何俱乐部都是一件很实惠的事情。也许大家还不知道,其实我在今年1月份的赛季中转会期里,就有过租借到别队的机会,但当时我就是考虑到那时我会有一笔不菲的转会费,这势必会影响到我的去向。所以,我才决定等到赛季结束,这无疑会帮助我找到更理想的新东家。 7 |   再具体解释一下,基恩与曼联的那种分手形式叫“解约”。当时曼联在基恩的合同还有6个月到期的时候表态不再留用他,这样基恩就领得了一笔曼联支付的违约金,这才远投他乡的。如果埃弗顿队在我合同未到期之际与我“解约”,他们是得付违约金的。(李铁) 8 |    -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000014/18.txt: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 |   第4场位:从第06020期胜负彩起,在第4场位上,最近11期足彩出现的数字序列为“31111331331”,已经连续11轮不出“0”,而此前“0”还是比较受欢迎的,这就意味着在连续11轮不出“0”后,本轮第4场位出“0”的几率很大,此外本场位目前连续出“1”的动力不是很强,如此看来,此场位拉齐奥VS帕尔马的比赛,彩路表明两队有望分出胜负。投注建议:3/0 5 |   第6场位:从第06025期胜负彩起,在第6场位上,最近6期足彩出现的数字序列为“330300”,已经连续6轮不出“1”。而此前本场位连续出“1”的次数极多,这就意味着在连续6轮不出“1”后,本轮第6场位出“1”的几率已经大大增强,如此看来此场位帕勒莫VS梅西纳的比赛,彩路表明两队有望和平收场。投注建议:1 6 |   第8场位:从第06024期胜负彩起,在第12场位上,最近7期足彩出现的数字序列为“3133313”,已经连续7轮不出“0”,而此前“0”还是比较受欢迎的,这就意味着在连续7轮不出“0”后,本轮第12场位出“0”的几率很大,此外本场位最近连续出“3”的动力过强,本场很可能出现回落,如此看来,此场位杜伊斯堡VS美因茨的比赛,彩路表明主队无望取胜。投注建议:1/0 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000014/19.txt: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 |   场次 对阵           5 |  时间        6 |  推介(128元)       推介(512元) 7 |   1 卡利亚VS国 米  8 | 14日21时           9 | 0/1               10 |  0/3 11 |   2 切 沃VS佛罗伦  12 | 14日21时            13 | 1                 14 | 0/3 15 |   3 恩波利VS阿斯科  16 | 14日21时            17 | 1                 18 | 1/0 19 |   4 拉齐奥VS帕尔马  20 | 14日21时            21 | 3                 22 | 3/1 23 |   5 AC米兰VS罗 马  24 | 14日21时           25 | 3/1                26 | 3/0 27 |   6 巴勒莫VS梅西纳  28 | 14日21时           3                  29 |  3 30 |   7 雷吉纳VS尤 文  31 | 14日21时           32 | 0                   33 | 0 34 |   8 特雷维VS乌迪内  35 | 14日21时          36 |  1                  37 |  1 38 |   9 科 隆VS比勒菲  13日21时30分       39 | 3                   40 | 3 41 |   10 拜 仁VS多 特 13日21时30分      42 | 3/1                 43 |  3 44 |   11 汉 堡VS不莱梅 13日21时30分      45 | 3/0                 46 | 3/0 47 |   12 杜伊斯VS美因兹 13日21时30分     48 |  3/1                  49 | 1 50 |   13 沙尔克VS斯图加 13日21时30分       51 | 3                 52 |  3/1 53 |   14 沃尔夫VS凯泽斯 13日21时30分      54 | 3/0                 55 | 3/0 56 |   上期成绩 11 10 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000016/10.txt: -------------------------------------------------------------------------------- 1 |   2 | 3 |   中国游客在马来西亚 4 |     中国“旅游休闲”商机,正从东南亚向东北亚“扇形展开” 5 |     新华网北京5月6日电(记者钱春弦)5月2日,从事服装设计的胡明明第四次飞往泰国普吉岛度假。黄金周对她而言,就是躺在普吉岛沙滩上,晒一周太阳。作为中国公民最早的旅游目的地代表景点,普吉岛代表了东南亚国家在中国消费者心目中的独特地位:回头客越来越多。 6 | 中国游客涌至,“标志”泰国从海啸中复苏 7 |     泰国国家旅游局的数据显示,2005年前往普吉的中国旅游者达10万人次左右,预计2006年这个数字将突破15万,从而成为泰国南部旅游业在印度洋海啸后全面恢复的“重要标志”。 8 |     中国国家旅游局等权威部门的数据显示,“五一”期间,除港澳特区游外,中国公民出境旅游的主要目的地仍然是周边国家,而东南亚国家是首选之地。目前,中国游客已经成为新加坡观光、饭店、百货、餐饮业提高利润,增加就业的支柱。 9 |     新加坡雄心勃勃要成为中国旅游者中转站。世界旅游组织预测,未来10年中国将成为世界主要旅游强国,成千上万前往非洲、印度洋国家的中国游客,将是使新加坡成为世界航运中心的重要因素。 10 |     与喜爱“老地方”的胡明明不同,喜欢新奇的安新“五一”去了柬埔寨。在中国政府帮助维护当地文化古迹同时,这些古迹又吸引了中国旅游者,他们的消费,正成为这个中国邻邦的收入来源之一。 11 | 12 | 5月4日,一名小朋友乘坐摩托艇在海上兜风。新华社发 13 | 俄罗斯、蒙古游成为今年新亮点 14 |     东南亚国家打出“山水相连”牌,韩国和日本旅游界则希望以“文化渊源”赢得中国“休闲商机”。在《大长今》、“韩流”等文化因素刺激之下,中韩两国之间的航线变得越来越繁忙。就在“五一”前,大韩航空宣布计划5年内将韩中航线增至50条。而中韩日三国各自的经济中心上海、釜山、大阪开始致力于发展旅游业“黄金大三角”,并计划在“五一”后以“三驾马车”联袂去欧洲营销。 15 |     旅游交通经济分析师刘斌说,2006年“五一”黄金周,中国周边旅游的新亮点是俄罗斯、蒙古国。随着夏季到来,北亚风光呈现出独特的吸引力。俄、蒙两国也已开始设法“分享”中国的“休闲商机”了。目前,俄罗斯专门为中国旅游者成立的“无国界世界”协会正全力以赴利用中俄两国互办“国家年”的机遇,吸引更多中国游客“北上消费”。 16 |     旅游观察家指出,中国“旅游休闲”商机,正从东南亚向东北亚“扇形展开”,并惠及越来越多的邻邦。 17 |     “五一”前后,中国南方航空股份有限公司开通北京至伊尔库兹克航线,这是南航开辟的第五条中俄国际航线。海南[图库]航空也宣布要开通圣彼得堡航线。中国公民周边旅游从东南亚向东北亚“扇形展开”,航空业界则“春江水暖鸭先知”。 18 |     刘斌认为,目前东南亚抢得中国“休闲潮”之先,可以为中国东盟经济贸易一体化“推波助澜”。东北亚地区作为中国主要客源市场,“双向流动”将催生“东北亚旅游圈”,从而与东南亚旅游圈南北呼应。可以预测,这一扇形最终将由东北向西北,经中亚、南亚在中国的大西南地区实现东南旅游圈与南亚旅游圈的接合。这样,中国人的休闲不仅将成为所有周边国家的商机,而且将成为中国与这些国家睦邻友好的“休闲纽带”。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000016/11.txt: -------------------------------------------------------------------------------- 1 |    【据新华社北京5月6日电】2006年“五一”黄金周,以新马泰为主的东南亚地区继续成为中国公民出境旅游休闲的主要目的地,与此同时韩国、日本观光界大力推动“东北亚旅游圈”以吸引中国游客;俄罗斯、蒙古国也加入争抢中国游客的行列。中国国家旅游局的数据显示,“五一”期间,除港澳特区游外,中国公民出境旅游的主要目的地仍然是周边国家,而东南亚国家是首选之地。(编辑小娜) 2 |    -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000016/12.txt: -------------------------------------------------------------------------------- 1 |   2006年3月底至4月初,在中国最大的出境旅游展——上海世界旅游资源博览会上,日本有关机构在进行宣传。伴随着“五一”黄金周的到来,许多中国游客走出国门,开始了他们的海外之旅。中国的黄金周不仅使国内旅游市场出现高潮,也为国外旅游业创造了商机。西班牙埃菲社日前报道说,一年3次的黄金周给国内外旅游者带来了良机。2005年,中国人外出旅行达到12亿人次,出境旅游达3200万人次。这个“亚洲巨人”已经是世界上最大的国内旅游市场。到2020年,中国将成为全球第四大旅游客源输出国。与世界其他旅游国家一样,西 2 |   班牙希望来自中国的游客能大量增加。但要实现这一目标,必须具备拥有接待中国游客的专门人才和开通到中国的直通航线等条件。 3 |   中国游客的足迹遍布全球 4 |   埃及的金字塔、尼罗河及南方卢克索的帝王谷、王后谷等,都是中国游客的必游之地,有着无穷的神秘感和吸引力。记者在采访中了解到,“五一”黄金周期间到埃及的中国游客人数比较平稳。因为现在埃及天气逐渐变得炎热,不是旅游的最佳时节。在金字塔前,一对年轻中国夫妇激动地告诉记者,他们从小就对金字塔心驰神往,现在终于如愿以偿,感觉就像在做梦。一名在外企工作的中国男子说:“新马泰我都去过了,也常去欧洲出差,但感觉还是埃及比较神秘,令人向往,以后有机会还想再来。” 5 |   由于今年三四月份泰国政局动荡,许多游客都取消了原定计划。所以,今年“五一”黄金周期间来泰国的中国游客不是特别多。泰国旅游局局长朱塔玛·丝瑞婉在“五一”前专门带着新线路和各种优惠折扣到上海搞活动,吸引中国游客。记者4月30日返回泰国前特地到中国银行北京分行打听了泰铢的兑换情况。平时泰铢是冷门币种,但这几天换的人特别多。与记者同机的一对香港夫妇说:“上次来,1港元能换5铢,现在只能换4铢多。” 6 |   就像外国人到中国不能不逛故宫一样,地处曼谷老城区的大王宫,是来泰国的外国游客的必去景点。“五一”黄金周第二天,记者来到大王宫,一位名叫帕拉提的讲解员谈到中国游客时很兴奋,他用不怎么流利的汉语笑着说:“中国游客最多,是No.1,其次才是日本和韩国的游客。我是个英语讲解员,但中国游客太多了,我不得不学习汉语。” 7 |   印度时代旅游有限公司的总经理瑞佳·纳亚尔介绍说,中国游客到印度旅游一般有3条线路:第一条就是北部印度金三角游;第二条是佛教圣地游;第三条是南部印度水乡游。她说,该公司近几年平均每年要接待不下30个中国旅行团,中国游客最想看的是印度神秘而多样的文化,然后是自然的风光。高72.56米的库塔布塔是印度最高古塔,是印度教文化和伊斯兰教文化交融的建筑。在该景区,记者遇到了一个来自上海的旅游团。领队吴女士告诉记者,近几年,来印度的中国游客特别多,尤其是在春节和国庆节前,报名来印度旅游的电话整天响个不停。“五一”期间,印度的天气特别热,泰姬陵里不让穿鞋,人们走在大理[图库]石地面上就好像踩在火盆上,所以游客并不多。尽管如此,来印度旅游的中国人还是比以前多了不少,据中国东方航空公司驻印度办事处的朱先生介绍,3年前在“五一”期间从北京飞往新德里的航班有一半座位是空的,现在,还不到“五一”航班就满员了,其中绝大部分乘客都是来旅游的。 8 |   各国准备迎接更多中国游客 9 |   中国正式开办公民出境旅游开始于1997年,当年的出境人数为532万人次,而2005年已达3100多万人次。面对中国游客人数的迅猛增长,各国都表现出了极大的热情,千方百计吸引中国游客。 10 |   法国旅游业和服务业非常了解中国的节假日,每逢黄金周,都会提前做好准备。新年时,埃菲尔铁塔上有专人向登塔的中国游客赠送印有“恭喜发财”和“新春愉快”等字样的纪念品。“五一”期间,中国游客获赠的则是法国的五一节鲜花——玲兰花。不仅国家旅游机构对中国游客十分关注,地方上也是如此。为提供更好的旅游环境,鲁昂专门开设了中文网站,伊勒-维莱讷省政府也准备设立办公室专门负责与中国游客有关的事务。 11 |   自从2004年欧洲向中国游客敞开大门以来,中国游客的人数与日俱增。据法国政府机构的统计,目前中国游客不仅在人数上已超过日本和美国,成为欧洲最大的外国游客群,消费能力也已超过了这两个国家的游客。2005年,来法国的中国游客达到60万人次,预计到2008年,将达到100万人次。埃菲尔铁塔、卢浮宫、香榭丽舍大街、巴黎圣母院、凯旋门和红磨坊等地都是中国游客的必去之处。巴黎的一些街道现在基本变成了中国人的免税店,那里很多店铺都是华人经营的,如果是法国人开的店铺,十有八九都有华人售货员。 12 |   埃及对接待中国游客很重视,在金字塔等主要景点,不但配有中文版的导游册,而且说中文的埃及导游也越来越多。埃及人认识到,欧洲、美国是他们的主要游客源,但这些国家的旅游市场基本都饱和了。正是看中了中国客源的巨大潜能,埃及才加大了吸引中国游客的力度。 13 |   日本政府提出“观光立国”战略,将中国列为最重要的游客来源国,并采取各种措施吸引中国游客。去年,日本全面开放了中国游客团体游。2006年春节,日本方面在位于富士山麓的“富士乐园”为中国游客举行了专场活动,与游客一起庆祝新春佳节。日本的许多旅游景点都设置了中文标志,并附有中文解说和广播,一些面向外国游客的免税商店或购物中心还聘请了能讲普通话的服务员和导购小姐。尽管日本的地名基本上都用汉字标写,但东京等主要城市的地铁车站还是增添了简体中文标志。此外,日本的金融机构还积极同中国银行业合作,有银联标志的中国银行卡目前可以在日本主要饭店和商店刷卡消费。 14 |   印度旅游部一名官员说,去年到印度来的中国游客有5万多人,尽管这个数字和10多亿人口相比实在是不值一提,但还是比前几年增长了很多倍。印度旅游部长乔杜里最近常说这样一句话:“中国是印度旅游业一个潜在的巨大市场,我们要想方设法把中国游客吸引过来。”印度旅游部最近在中国举办了“印度道路展”和“印度旅游研讨会”,在中国媒体上投巨资做旅游广告,向各旅行社发放旅游手册,并正努力在北京设立代表处。 15 |   外国人心目中的中国游客 16 |   埃及“三角洲”旅行社副总经理艾哈迈德告诉记者,中国人给他们留下了温文尔雅的印象,表现出了东方人的气质。不过,也有人认为中国游客“太小气了”,小费给得少,有的人甚至都不给。日本人对中国游客的总体印象还不错,认为他们很有购买力,能够促进日本的消费,但对部分中国游客在公共场所大声喧哗以及个别游客乱扔垃圾、随地吐痰等不文明行为也有一些看法。 17 |   由于出境游价格不菲,所以出境旅游的中国公民绝大部分属于高消费群体。他们的消费能力让“时尚之都”巴黎的人们感到震惊,巴黎市中心一家酒店的经理说:“中国游客来法国,是我们的一大商机,但旅游时间安排得太仓促,我们也失掉了不少机会。中国游客上车睡觉,下车拍照,一点都不挑剔,但他们买起奢侈品的阔气劲让我们十分惊讶。”有人专门编了个顺口溜:中国游客身体真棒,刚下飞机就来照相,早起晚睡吃住不挑,高档商品卖得脱销。7天游10国,2小时游完卢浮宫,其他景点半天搞定,晚饭后自费去红磨坊,一天就可以游遍巴黎,这在外国人听来简直难以置信。一对来欧洲旅行结婚的年轻人告诉记者:“这次就当锻炼身体,下次再也不跟团来了。” 18 |   埃及“星星”旅行社的负责人说:“去年到埃及的中国游客大约有近万人,虽然人数不是很多,但增长迅猛。中国游客喜欢边旅游边购物,许多人都购买大量的纸草画、金字塔模型、铜盘以及金银首饰等,这极大地拉动了当地的消费。“三角洲”旅行社的副总经理艾哈迈德说:“中国游客,尤其是公费组团来的,常常入住高档酒店,十分讲究排场,可以说对埃及的旅游业发展做出了不小贡献,景点附近埃及人家的生活因此大有改善。” 19 |   印度工业联合会的一份报告显示,中国游客的增多使印度五星级宾馆的入住率大大提高,中国游客喜欢大量购买印度的工艺品,对印度的经济是一种巨大的拉动。▲ 20 |   本报驻泰国、埃及、印度特派记者 任建民 黄培昭 任 彦 本报驻日本、法国特约记者 张莉霞 唐惠颖 本报特约记者 汪 析 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000016/13.txt: -------------------------------------------------------------------------------- 1 |    世界的旅游业越来越熟悉一个新名词——中国的黄金周。每到这个时候,中国都会迎来一次旅游高潮,一直席卷周边甚至更为遥远的一些国家和地区,使他们也跟随着这种固定的周期迎来一个个旅游、消费旺季。 2 |   尽管出入境管理部门尚未公布具体数字,全国假日办负责人预测说,今年“五一”黄金周,出境旅游规模很可能超过去年“五一”黄金周1000多万人次的水平。 3 |   中国游客涌来 4 |   “标志”泰国从海啸中复苏 5 |   5月2日,从事服装设计的胡明明第四次飞往泰国普吉岛度假。黄金周对她而言,就是躺在普吉岛沙滩上,晒一周太阳。作为中国公民最早的旅游目的地代表景点,普吉岛代表了东南亚国家在中国消费者心目中的独特地位:回头客越来越多。 6 |   泰国国家旅游局的数据显示,2005年前往普吉的中国旅游者达10万人次左右,预计2006年将突破15万,从而成为泰国南部旅游业在印度洋海啸后全面恢复的“重要标志”。 7 |   目前中国人出境游基本都是第一次出国,因此更看重价格。“中国人喜欢出访大城市,且往往都是走马观花,到哪里都要先照相。”一旅行社总经理助理郭明告诉记者。出境爱购物可能是中国人出境游的又一大特色。 8 |   俄罗斯、蒙古游 9 |   国人今年出游“新亮点” 10 |   东南亚国家打出“山水相连”牌,韩国和日本旅游界则希望以“文化渊源”赢得中国“休闲商机”。在《大长今》、“韩流”等文化因素刺激之下,中韩两国之间的航线变得越来越繁忙。就在“五一”前,大韩航空宣布计划5年内将韩中航线增至50条。 11 |   旅游交通经济分析师刘斌说,2006年“五一”黄金周,中国周边旅游的新亮点是俄罗斯、蒙古国。随着夏季到来,北亚风光呈现出独特的吸引力。目前,俄罗斯专门为中国旅游者成立的“无国界世界”协会正全力以赴利用中俄两国互办“国家年”的机遇,吸引更多中国游客“北上消费”。 12 |   羡慕黄金周 13 |   印度日本都“心动”了 14 |   旅游观察家指出,中国“旅游休闲”商机,正从东南亚向东北亚“扇形展开”,并惠及越来越多的邻邦。 15 |   刘斌认为,目前东南亚抢得中国“休闲潮”之先,可以为中国东盟经济贸易一体化“推波助澜”。东北亚地区作为中国主要客源市场,“双向流动”将催生“东北亚旅游圈”,从而与东南亚旅游圈南北呼应。这样,中国人的休闲不仅将成为所有周边国家的商机,而且将成为中国与这些国家睦邻友好的“休闲纽带”。 16 |   从发展旅游经济的角度来说,中国的黄金周无疑让各国羡慕。印度的一家报纸曾对中国政府“聪明并且执行有力的黄金周政策”大加赞赏,认为印度政府应当向中国学习。而日本为了促进旅游、拉动内需,也修改了“节日法”,人为地制造出更多的长假,方便人们外出旅游或安排各种休闲活动。(新华每日电讯) 17 |   新闻链接 18 |   悉尼 19 |   “处处是中国人,还以为回国了” 20 |   “到悉尼来旅游,到处都能看到中国人的面孔。要不是看到外国人多点,还以为又回到了中国呢!”一位来自北京的张姓游客说。 21 |   这也是不少中国游客初到澳大利亚时的感觉。去年,有28万中国游客赴澳旅游,占来澳游客总数的5.2%。 22 |   在去年12月澳大利亚联邦政府发布的旅游战略中,中国被认为是澳旅游业增长最快的市场。据澳旅游业预测委员会预计,中国到澳大利亚旅游的人数将以每年16.5%的速度增长,到2014年,将会有110万中国游客来澳旅游,澳大利亚每7名游客中就有1名中国公民。届时,中国将有望成为澳大利亚最大的客源国,中国游客每年将为澳旅游业贡献60亿澳元。 23 |   巴黎 24 |   中国人不再“上车睡觉下车拍照” 25 |   四五月份本是中国人赴法旅游的淡季,但“五一”长假却是淡季中的旺季,法国各大华人旅行社在此期间接待的中国游客数量几乎是平时的两倍。而中国人对赴法国乃至欧洲旅游的观念也发生改变。 26 |   据法国文华旅行社总经理陈超英介绍,过去,中国游客总想在最短时间内以最少费用游览到最多数量的法国及其周边国家景点。一时间,“上车睡觉,下车拍照,一问什么都不知道”这段顺口溜成了此类贪多求全的旅游方式的生动写照。 27 |   几年过去,随着出境游机会增加,越来越多的中国游客迷上了欧美游客所青睐的休闲游和主题游。陈超英说,以文华旅行社为例,参加休闲游和主题游的中国游客三年前只占中国游客总数的5%,现在已占到了30%,预计三年后将达到50%左右。他说,这不仅说明中国游客的消费能力提高,也说明他们的消费心理趋于成熟。 28 |    -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000016/14.txt: -------------------------------------------------------------------------------- 1 |   时报讯 昨天是五一黄金周的最后一天,游客们纷纷踏上了回家的旅程,宁波各大景区全面“退烧”。而此时,宁波的各大餐饮商场负责人却喜笑颜开。 2 |   宁波市假日办统计数据显示,7天时间内,宁波市共接待游客216.3万人次,创历年五一黄金周新高。全市旅游总收入达12.9亿元人民币,同比增长12.5%。也就是说,游客在宁波的人均旅游单项消费近600元。 3 |   随着人们旅游需求层次的提高,旅游正从观光时代转向休闲时代,这个特点在今年更为明显。“吃农家饭、住农家屋、学农家活、享农家乐”,乡村旅游景区成为了热点。 4 |   从宁波市接待的游客分布情况分析,大部分来自省内周边地区和上海、江苏等地,景区内各地牌照的私家车成为亮点和看点,特别是随着高速公路网络的完善,来自长三角地区、福建、江西等地的私家车明显增多,宁波市已成为长三角地区一个重要的旅游目的地。 5 |   今年的五一黄金周,宁波游客的出游观念趋于理性。和去年相比,出境游人数下降,国内游人数增长,但长线游的人数增长幅度不大,短线游和休闲度假线人气旺盛。宁波市民长线游主要集中在北京、海南、桂林[图库]、西安[图库]、大连[图库]、香港等地,长三角周边景点成为短线游的热点。甬金高速开通以后,往金华、江西方向的游客数量也呈快速增长态势。 6 |    -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000016/15.txt: -------------------------------------------------------------------------------- 1 |    新华报业网讯 “五一”黄金周昨天结束。从南京[图库]市旅游局和统计局的统计数据来看,今年“五一”黄金周旅游的主要指标再次创下新高。七天里,南京共接待旅游者274万人次,较上年同期增长22.3%;实现旅游收入18.95亿元,较上年同比增长25.2%,多收入3.8亿元。全市旅游接待人次及旅游收入双双刷新了南京历届黄金周的最高纪录。 2 |   黄金周里,记者截取不同时间段、针对不同采访对象进行了调查,对整个黄金周的旅游进行了全方位的盘点。 3 |   周边短线游客数量明显增加 4 |   数据:七天长假里,南京外出旅游度假的人数在百万以上,其中周边景点接待人数已经出炉:溧水傅家边农业科技观光园每天接待游客在千人以上,江心洲七天吸引了4万游客,浦口帅旗农庄每天接待游客人数同比增长30%,八卦洲接待游客2万人次,是去年同期的1.5倍,金牛湖接待游客2.1万人次,浦口珍珠泉旅游度假区接待游客12万人次,老山森林公园接待游客近2万人次,高淳瑶池山庄及迎湖桃园接待量超过5万人次。 5 |   解析:今年“五一”,出境游、国内游的人数都比去年同期增长,特别是南京周边的景点由于交通、服务设施逐步完善,把很多游客都留在了本地。另一方面,现代人休闲度假方式趋向多元化,花一两天用于本地游或短途旅游,其他时间还可参加健身、看碟、上网等其他活动,比整个假期都在外旅游的方式更加丰富。 6 |   随着今年“农家乐”快速兴起,市民流向城郊乡村成为“五一”黄金周旅游新热点。 7 |   景区接待游客数量再攀高点 8 |   数据:“五一”七天,南京主要旅游景区点共接待游园人次425万,较上年同期增长24%。一些新景区点也迎来了如潮的客流,绿博园“五一”期间接待游客突破14万人次,奥体中心每日的人流量在1.5万人次左右,阅江楼接待游客5.6万人次。 9 |   解析:大批游客蜂拥各大景区,景区门票收入大赚了一把,每天接近饱和的客流量对服务水准也提出更高要求,各景点基本能让游客满意而归。尽管如此,一些热门景点还是人满为患,游玩质量下降在所难免。从统计数据看,长假里主要景区的外地游客占8成以上,20%的本地游客其实完全也可以选择近郊的其他景点度过假期。 10 |   跟旅游团出游比例再次减少 11 |   数据:全市旅行社组团出游5.4万人次,接团6.8万人次,均较去年同期有了显著的增长。 12 |   解析:因为各景点为游客提供的服务设施更加到位,交通、住宿、餐饮更加便捷,游客不跟随团队同样可以轻松出游,不会有太多不便;走马观花的玩法使每个景点都不能细细观赏体会,这与现代人喜爱无拘无束、追求轻松舒适的旅游偏好已经不相适应。 13 |   经济型酒店成自助游客首选 14 |   数据:“五一”期间,南京旅游星级饭店平均客房入住率在80%以上,客房的周转次数和利用率达到最大化,除了节前的团队预订,宾馆适度预留的散客房间与市场需求基本吻合,旅游宾馆基本处于最佳接待状况。 15 |   解析:随着旅游市场走旺,游客对旅游舒适度要求更高,高端游客和豪华旅游团越来越多,于是星级酒店也能分得黄金周旅游的一杯羹。而100多元的价位,服务标准化的经济型酒店,近年来成为大量自助游客的首选。 16 |    -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000016/16.txt: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 黄金周里,哈尔滨[图库]市中央大街俄罗斯文化节盛装开幕。文化节历时5个月,期间将举办中俄艺术作品展、俄罗斯绘画作品展、俄罗斯民乐巡展等6大主题活动。 王世义本报记者杜怀宇 摄 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 |   “五一”黄金周,游人在镜泊湖畔欣赏到了漫山遍野的映山红。  张克非 摄 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | “五一”黄金周,五大连池[图库]风景区迎来旅游高峰。 34 |   接待人数比去年同期翻了一番。 35 |   本报记者 司汉科 摄 36 |   春回大地,花草初绽,黑龙江涌动着勃勃生机。据省假日办统计,“五一”黄金周我省接待国内游客179.6万人次,国内旅游收入8.08亿元人民币,分别比去年同期增长6.02%和9.2%;接待入境游客1.85万人次,旅游外汇收入552万美元,分别比去年同期增长12%和15%。黄金周期间无重大旅游安全事故和旅游投诉,各重点旅游城市和各大景区景点欢声笑语,秩序井然,今年“五一”黄金周旅游呈现出以下几大特点: 37 |   黄金周热提前 38 |   黄金周热的提前出现是今年“五一”黄金周最突出的特点。 39 |    40 |   虽然今年我省气温低于往年,但由于省内各级旅游部门提前进行市场预热和宣传,黄金周旅游市场非但没受到影响,反而更胜往年,且提前火了起来。 41 |   为充分享受春回大地的休闲惬意,各地市民纷纷避开黄金周高峰提前出游。4月中旬以来,进出我省的游客明显增多,五大连池、扎龙自然保护区[图库]、牡丹江镜泊湖等地都提前迎来了省外大型旅游团队。哈尔滨太平国际机场运送旅客8000余人次,比去年同期增长35%。 42 |   黄金周的火热趋势在“五一”期间得以延续且更加火爆。据省旅游局行业管理处处长王洪国介绍,“五一”期间,省内多家旅行社分别组织了百余人的团队来我省旅游,游客以俄罗斯、韩国、东南亚以及台湾、湖北、辽宁、四川、重庆等地为主。今年黄金周旅行社出游组团量与去年同期持平。北京、沈阳、千山、大连、华东五市等短线旅游较为火爆,因电视剧热播而闻名国内的山西乔家大院旅游线路异军突起,游客报名踊跃;长线游以海南、四川、云南三线为主,出境游以港澳、韩国、日本、东南亚四线增幅明显。 43 |   省内游成主旋律 44 |   今年“五一”期间我省春光明媚,各地草木返绿,处处洋溢着生机与活力。许多避开出行高峰的旅游者,选择一半时间在家休息,一半时间踏上经济实惠、轻松温馨的省内游。长假期间,80%的龙江旅游者选择到省内著名旅游景区及居住地附近的景区观光休闲,“龙江人游龙江”成为今年我省黄金周旅游的主旋律。 45 |   黄金周期间,省内著名旅游景区(点)纷纷举办特色活动,游客接待量均创历史最好水平。太阳岛风景区的俄罗斯歌舞风情表演、当代顶级艺术家代表作品展、俄罗斯商品展销等主题活动截至5月6日引来游客5.52万人次,门票收入127.8万元,分别比去年同期增长76.9%和413.3%。哈尔滨极地馆新编排的白鲸、海狮等动物表演,吸引游客日均万余人,其中绝大多数为省内游客,俄罗斯团队比春节黄金周有大幅增长。龙珠二龙山举办的“首届哈市大学生千人登山大赛”,吸引游客1.66万人次,同比增长8.5%。五大连池达子香旅游节吸引游客1.2万人次,门票收入30.76万元。截至5月6日,哈尔滨游乐园接待游客17万人次,门票收入154万元,同比增长209%和42.5%;扎龙自然保护区接待游客1.41万人次,门票收入28.2万元;兴凯湖接待游客1.35万人次;虎头经济开发区接待游客2.5万人次;大庆油田乐园接待游客1.29万人次。 46 |   乡村游备受青睐 47 |   龙江乡村“五一”不寂寞。在我省乡间公路上车来车往,尽是乡村旅游者,有自驾车友朋相邀的,也有乘大客车全家出行的。我省18家农业旅游示范点风格各异,哈尔滨市郊、齐齐哈尔、牡丹江、伊春等地的清新朴实的山野民舍、北方少数民族风情小屋、大湿地休闲别墅,吸引了众多省内外游客。他们或登山踏青,或采摘野菜,或徜徉水边,或赏民族歌舞,品味农家炖菜,尽情享受世外桃源的悠闲与恬静,体会与都市生活不一样的村野情趣。香炉山、帽儿山、松峰山、兴十四村、牡丹江朝鲜屯、铁力年丰朝鲜民族自治乡、同江街津口赫哲村等地“五一”七天宾客盈门。许多游客自主设计乡村旅游线路,一路游览多处乡村,给当地农民带来了可观的经济效益。 48 |   黄金周期间,哈尔滨市几家大的汽车租赁公司生意火爆,面包车、越野车等车型被抢订一空。玉泉狩猎场、长寿山、横道河子、五营森林公园、街津口赫哲族渔村等景区接待自驾车游客平均比去年同期增长了10%。 49 |   (黑龙江日报) -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000016/17.txt: -------------------------------------------------------------------------------- 1 |   本报讯(见习记者 张昱)5月8日,记者从银川市旅游局获悉,该市列入2006年五一黄金周数据统计范围的21家旅游景区,共接待游客17.6万人次,门票收入454.18万元,分别比上年同期增长14%和24%。 2 |   记者了解到,银川市今年五一期间,接待外来游客13.76万人次,旅游收入4180.34万元,比上年同期增长了21.24%和32.5%。其中,过夜旅游者5.78万人次,旅游收入2987.97万元,比上年同期增长21.4%和30.7%;一日游游客7.98万人次,旅游收入1192.37万元,比上年同期增长21%和37%;旅行社累计接团321个,累计接待人数1.21万人次,比上年同期增长7%和4%。 3 |   五一黄金周,银川市各旅行社累计组团310个,出游7734人次,主要出游目的地有山东、河南、北京、广州[图库]、四川、山西、陕西、青海、海南、云南、桂林[图库]等地。有来自北京、四川、安徽、大连[图库]等地的4个旅游包机和6个旅游专列抵达银川。出境游有港澳、日本、韩国、新马泰等地。黄金周期间,银川接待海外游客63人,分别来自泰国、日本、荷兰、美国、德国等国家。 4 |   来源:宁夏网 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000016/18.txt: -------------------------------------------------------------------------------- 1 |   【今日商报报道】 (通讯员 吕中 记者 赵文)据统计,“五一”黄金周期间,全省共接待游客992.49万人次,比2005年同期增长19.4%;实现旅游总收入70.93亿元,同比增长24.1%。 2 |   与以往“五一”黄金周相比,我省旅游市场呈现了以下特点:一是假日旅游协调机制有效发挥。经过前16个黄金周的考验,我省已经形成了一套较为完善的信息反馈和预警机制,假日旅游协调机制更加完善。领导重视程度高。随着我省投诉网络的不断完善和投诉渠道的不断增多,游客维权意识的进一步提高,今年“五一”黄金周7天全省共收到游客投诉81起,同比增长了一倍,其中投诉旅行社23起,占投诉总量的28.4%,所占比例同比下降16.7%。目前各类投诉达成处理意见的100%,协商处理完毕95%。 3 |   二是城市旅游服务功能日益完善。随着“城市即旅游,旅游即城市”理念的进一步深入推广,我省各市加紧建设景区间道路,加快完善旅游标识,相继建立旅游集散中心、咨询中心等,城市旅游服务设施更加完善,并在“五一”黄金周期间充分显现,游客满意率进一步提高。南京在地铁、内外秦淮河整治和新火车站等诸多城市配套工程相继完成基础上,充分发挥旅游集散中心的功能,将绿博园、奥体中心等一批新景点包装策划,受到市场的欢迎。 4 |   三是乡村旅游备受青睐。农业旅游正作为提高农民收入、提升农民素质、改善农村面貌的一项新的旅游产品,不断受到市场的青睐。南京根据对监测点的测算,节日前4天共有30万市民和游客体验了乡村休闲旅游活动,其中溧水傅家边农业科技观光园、江心洲景区、浦口帅旗农庄和迎湖桃园等全国农业旅游示范点接待量均较平时有了显著的增长,其中傅家边每天接待团队游客数千人,江心洲节日七天吸引了4万游客上岛,每天接待游客同比增长30%。 5 |   四是旅游活动丰富多彩。主要体现在:旅游节庆好戏连台。南京各大公园开展了各类主题活动,如玄武湖[图库]的《梦想中国》江苏选拔赛、夫子庙祭孔乐舞表演、明孝陵《大明华章》文化展演等,都吸引了不少游客参与。据对纳入统计范围的229个旅游区(点)的统计,节日期间共接待海内外旅游者1914.5万人次,同比增长22.8%;实现门票收入2.08亿元,同比增长24.3%。 6 |   五是休闲旅游将成为主流。主要表现在:自驾车游增长迅速。南京对夫子庙、中山陵[图库]等主要景点的自驾车游客进行了统计,这部分游客占到了13%以上。据对全省旅行社的统计,全省旅行社共接待游客41.28万人次,同比增长37%,其中本省游客24.68万人次,占59.8%;组团22.83万人次,同比增长28.9%;组织公民出境游6935人次,增长27.3%。 7 |   六是旅游拉动消费作用明显。“五一”旅游的火爆为住宿、餐饮、购物和交通等相关行业带来了商机。节日餐饮和旅游购物也是红红火火。南京、苏州、无锡、常州、镇江、扬州、徐州、连云港[图库]八市39家纳入“五一”黄金周监测的商业企业,共实现销售零售额7.12亿元,同比增长30.9%。 8 |    9 |    -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000016/19.txt: -------------------------------------------------------------------------------- 1 |   中广网5月9日广州图库消息(记者何伟奇 通讯员仇文确)据广东肇庆图库旅游部门统计,“五一”黄金周到肇庆各地主要旅游景区的游客人数达106万人次,与去年同期相比增长16%,其中城市接待旅游者人数为55.95万人次,同比增长10.2%,旅游收入2.09亿元,同比增长12.4%。 2 |    3 | 4 | 5 | 6 | 7 | 8 | 9 |    “五一”黄金周肇庆鼎湖山举行“山泉泼水节” 10 |   “五一”黄金周期间,七星岩图库推出的“十里走单骑”自行车环湖游、鼎湖山“山泉泼水节”、德庆醇正岭面古迹游、封开萝筐节、梦多奇溶洞、怀集燕峰峡温泉漂流、广宁竹海美食、四会造纸村访古、高要生态园寻梦等活动让游客感受到肇庆千里旅游走廊旅游“天天有新意、日日景不同”的休闲旅游新体验。 11 |    12 | 13 |     肇庆千里旅游走廊如诗如画 14 |   今年肇庆市不断完善旅游配套设施建设,在千里旅游走廊上新增设了多个一目了然的景区指引牌,为自驾车旅游人士提供了清晰的指引。此外还加强了旅游安全生产管理和规范旅游服务质量管理,推出了旅游志愿者服务,为到达景区的游客免费提供方便指引,受到众多中外旅游者的欢迎。 15 |   来源:中国广播网 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000020/10.txt: -------------------------------------------------------------------------------- 1 | 2 |   【来源:你来我网】 【作者:蝴蝶飞飞】 3 |   如果有一天,我们不在关心什么是关键问题,而是把关键性思考融入我们的思维习惯中,那么这良好的思维习惯,就会成为我们战胜一切问题的利器,为我们提供应对一切问题的真正关键的路径。 4 |   为了爱----我考研 5 |   初恋多少都有些骗局的味道,可是我竟迷恋的那么持久,或许正是那场无情的游戏,才使我的考研如此顺利。执手相看已不再有往日的情感,却难挥去那份刻骨铭心的记忆。从此后漂泊的心在何处栖息,还会不会有浓情酿就的泪滴?高山流水依然是我永远的寻觅,不再苛求爱恨随缘聚散两相依。 6 |   他大我八岁,又在攻读博士学位。他说他博士毕业已经整整三十岁,那时的他更需要一个家,他说像我这样年轻的女孩,离开了校园,走进生活,会很快忘记他。为了爱,也为了满足我天生的虚荣,跟他拉近距离,我决定了考研。直到现在我依然认为我的成功一半的原因在于他的督促,另外的一半原因是因为我自己的努力。在这里,我把自己成功的考研历程展示给大家,希望能给匆忙备考的你提供些许借鉴。 7 |   关于报考院校----选择我喜欢的 8 |   一般来说,选择专业比选择学校更重要,一旦你选择了自己喜爱的专业,再根据自己的实际情况选择颇有名气的学校,这样的选择才是明智的。切记,不要为了上名校而盲目的选择自己并不喜欢的专业,而又不得不去学习那些课程,为考试而学习,为毕业证而学习,这样不但折磨自己,而且很难学有所成。因为即使你腰缠万贯,享有很高的声誉,但是,你所从事的不是自己喜欢的工作,日子对你来说过的会很痛苦的。我之所以选择陕西师范大学,是因为我考虑到了自己的爱好和实力,加上他严谨的治学态度。运筹帷幄方能决胜千里,我终于可以如愿以偿的研究自己喜爱的先秦文学了。 9 |   备考秘笈 10 |   在准备考研的过程中,就我个人经验,十分关键的是: 11 |   (一)时间的安排,今天做什么,明天做什么,一定要心中有数,要周密安排自己的作息时间,制定学习计划,并认真的去执行,决不能散漫无序的混日子。 12 |   (二)有效的利用时间,提高单位时间的学习效率。每个人要根据自己的“生物钟”和学习环境对时间做出科学的安排,利用大脑最清醒、记忆力最强的时间去学习,这样可以收到事半功倍的效果。我喜欢白天看书,晚上入睡之前再回忆这一天所看的内容,以加深记忆。 13 |   (三)注意锻炼身体。“身体是革命的本钱”,无论到什么时候,身体对于我们来说都是最重要的,我那时候和舍友约定好每天6:00起床然后去操场沿每圈400米的跑道跑三圈,之后背一个小时的单词。当时我用的是人民日报出版社的黑博士8100快速突破然后再吃饭。这时的晨跑作用在于清醒大脑和避免赖床不起,产生一种清新舒适的学习心情。冬天的时候,我将锻炼的时间安排在下午5:00左右,这时刚好经过一整天的复习,以少量的身体锻炼来减少些许疲劳,调节枯燥的学习生活,之后再去洗澡、吃饭、上晚自习,会轻松许多的。 14 |   (四)坚持不懈的精神。既然选择了考研,就应该承受得起他的枯燥与艰辛,或许你要为过分的闷热和严酷的冰冻而打退堂鼓,或许你要为教室----宿舍----饭堂三点一线的单调倍感乏味,或许你会因为整日不见心中的他或她而产生孤寂之感,面对这些你一定要坚定信念,要始终相信阳光总在风雨后,所有的付出都是对你顽强意志的考验,而这正是能否成功的一个关键,所以,面临如此的意志测试,你一定要坚持! 15 |   虽然我的成功并未换来自己所要得幸福,但是,没有他的鼓励,我知道我是不可能这么容易成功的,整个复习过程中,他无时无刻不在悉心鼓励我,他的一个激励,一个眼神,都能够促发我心中无尽的力量,在见不到他的今天,我同样感谢他对我的鼓励,但愿处于甜蜜爱情生活之中的考研者们能够互相理解,互相鼓励,让你们的爱情也为考研加油! 16 |    -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000020/11.txt: -------------------------------------------------------------------------------- 1 | 2 |   【来源:你来我网】 【作者:kiidy】 3 |   “花落繁枝千万片,犹自多情,学雪随风转”,2006年的春天,这种莺飞草长、树绿花香的常景,在我眼中变得特别的美丽。一年的时间,在许多人的生活中都不会有什么特别、不会产生多大变化,但在同样的时空中,在与别人一样的收获之外,我完成了考研的复习,是这种成功使我体会到了风景与心情的不同。我不是聪明人,也不太笨。 4 |   做每件事要想成的都挺不容易的,所以我干什么事情,只要认准了都特使劲。考研是大事,从一开始就没想过不考,原因很多:父母的期望,逃避工作及喜欢校园生活。 5 |   考研,真的爱你吗? 6 |   我想并不是每个同学都想考研,还有许多不考研的友人们对我们考研大军不屑一顾,事实是考上了也并不一定就前程似锦,要知道两三年后依然是面临很大的就业压力,而工作的同学已经是经验丰富,在职场上有所作为了!这要看个人的追求、家庭经济状况,要综合来衡量自己是否需要考研,是否有必要再拼一次。如果知道了自己下一步该干什么,并且目标明确,那就只管拼了。早期气馁的,中途放弃的,上了考场还没考完的大有人在,所以下了决心就要坚持到底,俗话说“坚持到底就是胜利”用在考研上是最恰当不过的了。 7 |   跨专业,做我想做的 8 |   我没考化学类的,而是选择了管理类,原因依然很多,主要是我对化学不来电,高中学得就不好,大学成绩也不好,我很了解我自己,考上了我还会像读本科那样痛苦,混日子,浪费青春,我是不会在这一领域有什么建树的。活了这么大有太多的迫不得已,想让自己的想法和意愿做一次主,于是我选择跨专业考研。大家都知道相对来讲,理转文易,文转理难。对于理工类的同学来说,只要英语比较不错,选择文科中的经济,管理类的考数三、数四的是比较有优势的;要是选择心理学或是法学这样的专业,就要求你有浓厚的兴趣和良好的记忆力来支撑,要有比较好的英语基础,这样胜出的机会才大一些。 9 |   在选择院校方面要依人而定了,跨专业的同学选择34所(截至笔者报名,全国有34所院校独立招收研究生,划分数线,提前复试)还是会明智一些,由于34所复试比较早,若不幸被刷那还可以调剂,还有复试的机会。若报考很强学校的热门专业,风险必然很大。我经过再三考虑还是决定考旅游管理专业的最知名学校之一——北京第二外国语学院(中国旅游学院),这样便开始了我快乐的考研日子。 10 |   复习,持久战 11 |   当时我自视英语还行,数学不好,于是上了两个数学辅导班,别的班没上。现在回头看我有许多复习中失误的地方,在这里可以说一下,大家引以为戒。我是题海战术型选手,由于采纳一位研友的建议,我在后期很少做模拟题,只顾钻历年真题,分析出题的大方向,而去年的考题是多而不难,要求计算能力强,我是会做而做不对,那题错得太垃圾了。前期的努力大半都在后期折腾没了。考完后有许多同学说有原题啊,做过之类的话,我是听得一头雾水,那题我可是从来也没见过,还有,我保证题也没见过我。数学是难点,但不是不可战胜的,我总结,要考好数学,基本功是必不可少的,一味钻高难度的题是得不偿失的。因此,要宏观、微观一起抓,两手都要硬! 12 |   专业课我是下了很大的功夫的,书看了十几遍吧,记不清了,还做了读书笔记,把所有可能考的全都列了出来。没办法,谁叫我跨专业考呢,于是早上背晚上背,一遍一遍,像个精神病人。 13 |   英语的复习是全程的,每天都要练习听力,背背单词,阅读复习资料也看了许多,英语关键是培养语感,黑博士的120篇,220篇,240篇,我连着都做完了。历年考题,反反复复也看了好多遍,要知道我所报考的二外(北京第二外国语学院)对英语要求可都不低,对手都是很牛的人啊,英语都得七八十分。现在多做些题,分析几百篇阅读,最起码考完我不后悔。所以奉劝英语过了六级的同学不要大意啊! 14 |   坚持,给我力量 15 |   到了后期心里想的就这么一句“坚持到底就是胜利”。那时身体不是很疲惫,但心里很是疲惫。很多同志到后期依然天天坐镇,但究竟效率如何,学了什么,也只有他自己最清楚。我那时隔一段时间就放纵一下,打打排球或是和研友们定期侃侃,总之要学会自我调节。走出考场的那一刹那我想的不是考得怎样,而是以后我做什么都不怕了。因为我为了自己的理想坚持奋斗了十个月,那可是三百多个日日夜夜啊,容易吗我! 16 |   我们寝室有四姐妹,每天相互鼓励,共同学习,有哪个想偷懒了,其他三个会同时谴责她。无疑,这样的氛围是考研路上最可贵的,可惜的是最后只有三姐妹上了考场,还有一个月就考试的时候,另一个美眉说什么也不学了,任我们百般劝说。后来我们三个都考上了(她俩分别被北京化工大学、长春理工大学录取了),美眉把肠子都悔青了。还是那句话:考研路上早期气馁的,中途放弃的,上了考场还没考完的大有人在,所以下了决心就要坚持到底。坚持到底就是胜利。 17 |   调剂,恨你然后爱你 18 |   成绩出来了,335分,差额复试要排在48名左右,我的排在50名左右,因为我报的专业方向太热(旅游企业管理),心想是没戏了,而且二外不是34所自主招生的院校,复试比较晚。我便像个无头苍蝇一样到处搜索联系调剂学校,很快档案就被湘潭大学调走了。当我在湖南复试时,二外才出复试线,呵呵!除了我报的方向是339分左右,其他的方向都是320分左右,我还想调剂到二外的其他方向,可档案已经调走了,这时想回也回不去了。二外的学长和我说:“你丫就安心在湖南复试吧!其他方向你也调不了啊!二外350分的复试都不一定上呢,调剂是正确。”这样也给我了很多安慰。幸运的是我调剂到南方一所比较有名的重点大学,学校环境很好,让我欣喜。更幸运的是,我跟了一位好导师——阎友兵教授,他不但是我学术研究上的带头人,更是我做人处事的好榜样。在老师和朋友的支持下,我已经下定决心考博,圆我二外的梦! 19 |   这就是我的考研之路,辛酸苦辣,冷暖自知。 20 |    -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000020/12.txt: -------------------------------------------------------------------------------- 1 |   话题多、题材广、时间紧、要求高的议论文写作一直是雅思写作中的难点,思维狭窄、词汇不足也一直是中国考生的通病,如何在议论文写作中拓宽思路?怎样背诵8000个雅思词汇?备考雅思写作的误区和应对方法又是什么?上周末,启德教育吴建业老师在广州图书馆给广大考生上了一堂生动的雅思议论文写作课。 2 |   开拓思维的十大原则 3 |   据统计,近年来雅思议论文写作共有265个话题,常考的涉及环保、经济、社会、教育、犯罪等题材,十分广泛。鉴于很多考生写作时感觉无话可说,吴建业提醒考生从经济、时间、健康、情感、教育、心理、权利、文化、环保和道德十大原则来思考话题的意义。他以养狗为例:经济上要花很多钱;情感上亲近狗就会在一定程度上疏远家人;遛狗、给狗冲凉等浪费时间;狗传播疾病会影响健康;养狗会影响学习;狗很忠诚,养狗会让人从心理上疏远狡诈的人类;侵犯邻居的权利;狗到处排泄会破坏环境等。“这样大家碰到任何一个话题都不用心虚了。”但是他同时提醒广大考生不必面面俱到,只要挑出十大原则中的两三点来自圆其说就绰绰有余了。 4 |   记住800个核心词汇 5 |   “垃圾怎么说?可回收垃圾?可降解的垃圾?……”课堂上,吴建业关于垃圾的几个提问难倒了很多在场的英语专业的学生。吴建业老师表示,中国学生在学校学习的词汇在很多场合用不上,比如英语专业八级侧重于文学名著,商务英语则侧重谈判、商业词汇。雅思需要8000词汇,但相当一部分考生疯狂地从A背到Z,还存在想说却说不出来,即使说得出来也衔接不来的问题。怎么办? 6 |   “分类背诵,联想记忆。”吴建业告诉广大考生,只要掌握了800个词汇,就可轻松应对雅思写作。“当然这些词汇是剔除了dog、pig之类的核心词汇。”那什么词才叫核心词汇呢?吴建业举了一个例子,如由奢侈→贫穷→救助→难民→……,就这样把相关联的词汇串通起来背诵,既掌握了词汇,而这些词汇往往是一篇文章中可能涉及的内容。 7 |   写个性化的八股文 8 |   吴老师还指出了考生的备考误区和应对方法。针对很多人希望通过学习外文名著来提高写作水平的想法,吴老师认为外国名著对大多数中国考生而言是可望而不可及的。“外国人学汉语要学习汉语说得好的大山和大牛,而不可能让他们学习鲁迅先生的《药》、《孔乙己》等名篇。”同样,中国考生要学习英语学得优秀的中国人,他认为真正优秀的教材其实是中国考生的优秀范文。 9 |   提到一些辅导老师教育学生写作文一定要真情流露,想到什么就说什么,吴老师认为这是不现实的,因为对大多数中国考生来说,做到挥洒自如、下笔自若、真情流露很难。而很多人争相背诵名师的范文又搞得千人一面,味同嚼蜡。鉴于此,他认为既要学习范文的格式,又要有所改装,加入自己的东西,凸显个性,“写个性化的八股文”。 10 |   讲座上,吴老师还提醒考生写作时不要想着标新立异、旁征博引,只要能够自圆其说,多用权威、翔实的数据事例来说明观点就好,否则会画蛇添足。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000020/13.txt: -------------------------------------------------------------------------------- 1 | 2 |   一番周折后终于在多伦多考完了新托福考试,整个考试持续了近8个小时。为什么呢, 3 | 因为考完了第二部分听力后,美国ETS考试中心的Server出了故障,让所有当天的考 生苦苦等了3个小时,而且中间不许离开。笔者所在的考场有耐心坚持到最后的考生 4 | 连一半都不到。这3个小时让我有机会把考试中心的情况了解得更清楚一些:考场布 置成一个开放式的办公室,每个考生都有自己的cube,但不隔音,由于口语考试考场 5 | 内到处能听到说话的声音。笔者所在的楼层能容纳16人,当天有3个欧洲移民(看上 6 | 去都四五十岁了),5个印度人,2个南韩人,2个香港女孩,一个从Kingston来的亚裔 7 | 男孩,还有一个就是我了,是唯一一个中国大陆来的(很显然中国同学都被吓住了)。 8 |   考前我原以为新托福当场能像机考TOEFL一样给我一个成绩范围,好歹安慰一下我8个小时 9 | 下来疲惫的心灵,结果没有,最后考场工作人员告诉我要等3-4周后我才能收到成绩,所以 10 | 大家要注意了这是和以前很大的一个不同。由于不知道考试结果,我只能和大家分享一下 考试体会。新托福决无想象中和各种广告中宣传的那么难,但要考好,必须有综合的考试 11 | 技巧,一定的英文能力和较快的反应速度。 12 |   一.考试技巧分成2个方面:一是考生必须要相当熟悉新托福的考试形式和内容。 考试总共有4大部分。 13 |   1.阅读: 14 | 过程中不可作笔记,共3篇文章40个问题,要求60分钟内答完。这3篇文章又分成两个独立计时部分,前一部分只有1篇文章14个问题,20分钟内解答,其间可以返回;第二个部分是另外2篇文章40分钟,之间也可以返回。 15 |   2.听力:按ETS的介绍,听力应该只有2个独立的计时部分,每部分中有1个长对话和 2个long lectures, 16 | 每个部分的答题时间是10分钟。但我当天却遇到了3个独立计时部分,后来才明白其中一个部分是实验题,但考试时是不知道那个部分的。(听力完毕后,考生有10分钟休息时间,我建议带点吃的喝的。) 17 |   3. 口语:共6个问题。第1,2 个问题是大家熟悉的话题,各给15秒准备,用45 秒对着耳机上的麦克风回答,由电脑严格记时,有点像对着answer 18 | machine留言的样子。第3,4 个问题先给45秒读一段文章,然后听一段话,再让你口头总结和概括,给30 秒准备,60秒回答,前者主要是关于student 19 | life, 后者是 academic 方面的。第5, 6题是让你听一个对话和一个academic方面的段子,然后20秒准备,60秒回答。 20 |   4. 21 | 写作:2篇文章。第一篇是先3分钟内读一段文字,再听关于这段文字的一段评论,然后在20分钟内写出一篇150-225个词的文章。写文章时,所读的文章会出现在屏幕的左侧,并且电脑会显示你所写的字数。第二篇文章是在30分钟内写300个词的文章,题目显然仍然是从原机考TOEFL作文题库中选的。现在的写作部分均只能打字,不再有手写这一选择。 22 |   考生在熟悉了考试内容后,就必须熟练掌握各种题的解题技巧。阅读部分应学会 对文章本身的处理,10大题型尤其是插句子题,组织信息和总结题的解法。听力 23 | 部分现在变得更长更臭,究竟什么地方是考点必须会预测和记笔记,尤其是针对 2选题和排序题。口语部分仅靠现场临时发挥是不够的,必须背一些模版和常用 24 | 句子,这样才能尽可能表达清楚和连贯。写作的2篇文章要求考生熟练掌握驳论 文和议论文的写法:第一篇一定是让你写出说话者是如何反驳阅读文章的内容的, 25 | 这种文章的写法套路非常固定;而另一篇的8类写法考生也必须熟悉并在考前勤加 练习。 26 |   二.英文能力 27 |   从阅读开始就要求考生具备一定的词汇量,不用太多,6000就可以了。有些书 建议大家每天背60个单词,这是不够的,我建议大家每天至少要看300个单词。 28 | 在打下词汇基础后还需一定的阅读能力,阅读中有三种题均在考能力,一道问 下面那句话是原文的改写;一道是句子插入题;一道是总结文章内容题。 29 |   听力部分也是一样,满脑子技巧就是听不懂,上去考试肯定没戏。建议大家 从精听着手,辅以泛听,2个月内一定能有质的提高,但前提是每天至少听上 30 | 2个小时。 31 |   口语部分。各位中国考生应该感谢ETS给我们提供了一个提高英语口语的机会。 32 | 不少人总想不通新托福为什么要加考口语,一提到这个问题就怨声载道。我建 议大家调整一下心态,有这个埋怨的时间还不如多练习练习,课堂上练,课后 33 | 练,对着老师练,对录音机练,口语很快就会提高了。毕竟口语除了考试要用, 也是日常生活中最practical的,我们已经听说过多少因为口语不好和自己喜 34 | 欢的工作失之交臂的故事了。 35 |   写作部分要求掌握文章的结构和遣词造句能力,否则很难拿到高分。 36 |   三.速度 37 |   考生需要阅读速度快,听力反应速度快,口语部分表达快,写作部分键盘速度快。 38 |     (来源:搜狐教育社区) -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000020/14.txt: -------------------------------------------------------------------------------- 1 |   50余名沈阳市职业学校校长近日走进清华园,在沈阳市教育局与清华大学共同举办的首期沈阳市职业学校校长高级研修班上为自己,更为沈阳的职业教育而“充电”。 2 |   沈阳市中等职业学校重组于上世纪80年代,绝大部分学校是由薄弱学校改造而成。近年来,随着国家、省、市各级政府对职业教育的重视,沈阳市职业教育 3 |   有了较大发展。目前,沈阳市已有中等职业学校131所,中等职业学校教师9500人,专业教师4800人,在校生9万余人,年毕业生3万余人。 4 |   2006年,为了让职业教育有一个更大的发展,沈阳市决定不仅在硬件上加大投入,按照国家级示范校的标准建6所万人规模的中等职业学校,同时,还要在在软件建设上有一个新突破,按照国家职业教育教学质量评估标准,全面提升沈阳市中等职业学校教育教学质量。为此,沈阳市教育局借助清华大学这样一个高层次的培训平台,举办各种层次的共10期研修班,对分管各项工作的副校长和专业教师约500人进行培训,通过国家教育部职业与成人教育司有关领导、国内优秀企业家、教育专家、知名学者和国内重点职业院校校长的讲座及经验交流,使参加研修人员政策水平、理论知识、教学管理能力及个人学养得到提高,从而全面提升沈阳市职业院校的内涵建设,进一步培养、打造出一支高水平的职业院校优秀的管理者和“双师型”教师队伍。 5 |   沈阳市副市长王玲、沈阳市教育局局长李梦玲、教育部职成司副司长刘占山、清华大学副校长陈吉宁参加了首期研修班的开班仪式。他们表示,清华大学和沈阳市的这种合作,必将促进沈阳市职业教育的跨越式发展,双方在市、校人才合作培养模式上的有益探索,不仅会加深和扩大双方在各个领域的合作,也会对全国的职业教育提供有益的经验。 6 |   来源:光明日报 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000020/15.txt: -------------------------------------------------------------------------------- 1 |   每小时付费过百元 孩子压力大不领情 2 |   请家教不为辅导功课,而是帮孩子填报志愿。昨天(9日),北京高考填报志愿网站刚一开通,不少家长就开始雇用大学生当起了“志愿家教”。北师大家教中心的负责人说,目前已有数十位家长来登记。而在其他一些家教中心也出现了类似需求。“志愿家教”主要由大三、大四和研一的学生担任,费用一般为每小时100元至200元不等。 3 |   家长 4 |   向大学生打听高校情况 5 |   家住六里桥的许女士正读高三的儿子就要报志愿了。昨天(9日),她专门请了半天假到北师大家教中心打听“报志愿家教”的事儿。“家里人都不熟悉大学情况,问学校老师又怕老师忙不过来,因此想找个大学生当报志愿家教,给孩子讲一些大学的情况,比如学校风气呀、生活条件什么的,让我们心里有数。”许女士说,希望能找个大三、大四的学生当家教,对大学比较了解,和孩子年龄又相差得不太大,比较容易沟通。 6 |   家教 7 |   “过来人”经验有助抉择 8 |   北京师范大学大三学生葛庆已经和一位家长签好了合同,从昨天起,他将连续5天到考生家中辅导报志愿。葛庆说,自己去年就辅导过家里亲戚的孩子报志愿。“上了大学之后,才知道大学到底怎么样。考生光看一些介绍是不够的,就是应该多听听‘过来人’的说法。以我对大学的了解,我会给他我的建议。我在考生家里首先多和他聊,看他的兴趣,然后根据我的资源和经验帮他了解这个学校的情况,食堂的条件、宿舍的情况、考研的比例、某专业就业情况等。”葛庆笑着说,还有学校里男女生比例多少、女生是否漂亮什么的。这些信息对考生作出选择应该很有帮助的。 9 |   考生 10 |   被过多干涉感觉压力大 11 |   尽管家长乐此不疲,但高三学生小峰对妈妈请来的“志愿家教”并不喜欢。小峰说,“报志愿有这么难吗?要想了解学校的情况,上网查查不就行了,干吗非要花钱雇人呢?本来是我自己的事情,这么多人为我作主,让我反倒没了主意,也让我觉得压力特别大。” 12 |   专家提醒 13 |   不宜增加考生心理负担 14 |   “利用‘大朋友’的经验来帮助孩子,这是国外一种常见的做法。但这么做一定要有个‘度’,不要过多地给孩子增加心理负担。”北京青少年法律与心理咨询中心主任宗春山说,采取各种方式更多地关注孩子,实际上是家长内心焦虑的一种表现。高考在即,适当地“忽视孩子”是必要的,应该给孩子创造一个轻松的应考环境。也有专家指出,大学生们对大学的认识是否客观正确?是否会因为自身的局限给考生误导?专家建议,“志愿辅导”只是辅导,考生应有自己的选择,家长也应该尊重考生的意见。 15 | 编辑:苏琳 16 |    -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000020/16.txt: -------------------------------------------------------------------------------- 1 |   【来源: 太奇MBA】 2 |   英语各项复习及对策 3 |   英语试卷满分为100分,考试时间为180分钟,试题分为五部分:词汇知识,综合填空,阅读理解,英译汉和写作。 4 |   词汇和语法是语言能力的基础,没有丰富的词汇和对语法知识的掌握,一个人的英语水平不可能真正得到提高,部分考生认为词汇、语法所占分值不大,就以为词汇和语法不重要,放松甚至放弃对语法和词汇的复习,这是舍本逐末的做法,是极其错误的。除了单项选择外,其它部分考题也与语法、词汇密切相关,如完形填空,既要考词汇,又要考语法。阅读理解,、翻译、写作等题型的考试,也需要考生对词汇和语法的熟练运用。 5 |   词汇的复习是英语备考的基础,但单纯的词汇记忆费时而收效慢,大家一定要结合阅读、翻译等练习来记忆单词。建议大家在复习前期集中一段时间,如每日2~3小时,进行词汇的密集记忆,目标是对大纲内词汇、习惯用法有大概但全面的了解。在备考中期,考生主要借助阅读与翻译来巩固词汇,这一阶段要注意方法,先做阅读与翻译,然后再查询并记录印象模糊的单词与词组(这部分词汇要抽空经常复习),大学一定要注意,一边阅读一边翻词汇手册是最糟糕的复习方式。备考后期,特别是考前,考生一定要重新过几遍词汇,力求留下清晰印象,避免因词汇的不熟练而影响阅读速度。 6 |   在备考过程中,最好准备一本附有例句和常用搭配的MBA词汇手册。 7 |   阅读理解这一题型占了英语总分的40%,是MBA中的重头戏。阅读理解能力的强弱从总体上反映了一个考生的语言运用能力,考生要提高阅读能力,就必须进行大量的阅读。在阅读中精读和快读相结合,是提高阅读水平的有效途径。许多考生说自己做了很多题,看了很多文章,但水平还是老样子,其中的主要原因在于他们没有对文章进行精读。我们应该明白,只有精读才能打好我们的语言基础,如果一味求快,老是快读,英语水平是很难实现质的飞跃的。 8 |   我建议那些英语基础比较差的考生平时练习要以精读为主,每天看两三篇文章,注意文章的主题、段落大意、核心句、关键词,对一些长句难句进行透彻的分析,遇到生词要用小本子记下来,必要时回过头来查字典,一些好的例句和好的表达方式要背下来,打好语言知识的基础,这样对短文写作也有好处。在这个基础上再适当安排一些快读,一般精读和快读的比例为1:3,当然这不是绝对的,大家可以根据自身的情况进行调整。只有在做了大量精读的基础上,大家才能快读,才能快速从短文中获取有用的信息,在考试中取得好的成绩。 9 |   英译汉考题主要测试考生根据上下文用汉语准确表达原文意思的能力。这方面能力的提高可以从两方面的着手。 10 |   一方面要对阅读理解时遇到的长难句进行深入的分析,搞清句子的结构,词汇的含义,有些词汇的意思字典中都没有,大家还得根据上下文的意思进行词义的引申。 11 |   另一方面,要坚持做一些单项的英译汉的练习,选择的训练材料最好是英汉对照的。训练时要争取不看答案,尽量根据上下文的意思来翻译,然后再对照原文进行比较、思考、推敲,找到自己的不足和弱点,如果是句子结构上翻译的错误,就必须在训练中加强对句子结构的分析。 12 |   在翻译技巧上,现在很多考研指导书都有所涉及,大家可以选择一本好好研读。翻译讲求的是“信、达、雅”,信就是要忠实于原文,达要求的是翻译出来的句子必须准确表达原句的主旨和大意,雅指翻译的句子生动流畅,而不是生硬涩口。大家做到了这一点,自然就能在考试中得到自己理想的分数。 13 |   突破英语写作难关首先需要掌握一些固定的句式。把平时自己喜欢的句子用汉语写出来,固定下来,之后就套用英语句式。比如It’s + adj. + that / to 就是比较典型的一种句型,可以经常套用。这其实就是一项“汉译英”的工作,考生在作文时,很难临场即兴写出那些正确而优美的句子,只能靠平时积累下来。 14 |   其次可以把自己写的句子“炫示”于人。为什么要让别人看自己的“弱点”呢?原因就是,考生根本无法判别自己造出来的英语句子是否正确。而在阅卷时,句子错误或不通是很大的一个失分点。在高手的修正指点下,受益的还是你自己。 15 |   此外,注意学习动词,尤其是动词词组的用法。英语句子的构造以动词为主,写出地道的英语句子也以动词或动词词组的妙用为本。如有这样一句经常出现在作文中的话,“许多恼人的问题仍然悬而未决。”很多考生会这样写:Many puzzling questions are still suspending. 转换一下动词:Many puzzling questioned remain unanswered. 效果就大不一样了。 16 |   当然,提高笔头表达能力才是真正的关键。1 多读范文;多读范文能使考生了解写作方法,写作的常用词汇,记住其中一些比较好的用法。2 多写作文;第二轮复习应该坚持每周写一篇作文并且要把每一篇写好,不要在一个水平上反复重复,要力争写好每一篇,这样写几篇后就会有收获。临近考试,可以按照规定时间写作,此时写作的题目要广泛,各种话题都要写一些,以增强适应性。3 写作时可以多查字典,不看范文;写作时遇到不会写的词句要多查字典,还要看该词的用法,这样才能保证正确使用;写前不要看范文,看了范文会影响自己的思路,写完后再参看范文。4 注意书写整齐;平时写作就要注意书写整齐,规范,要在平时养成良好习惯,在考场上才能发挥得好。 17 |    -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000020/17.txt: -------------------------------------------------------------------------------- 1 | 2 |   【来源: 太奇MBA】 3 |   数学各门课的特点及复习对策 4 |   从考生总结一句话:得数学者得天下。在复习的过程中,要针对不同的课程复习特点进行复习。初数部分知识点少(主要就是绝对值,不等式和方程,数列,),概念简单(大部分都是在高中学过的),技巧性强(同样一种题可以用很多种方法去分析),题型变换性强(同一个知识点可以引申出很多题型),所以这部分考试容易失分,做题的时候一定要细心。每年考试往往不是最难的部分如微积分失分最多,而是初等数学部分失分最多,稍微一不留神就会少考虑一个条件。初数部分的复习对策就是抓重点,也就是抓必考题型(如绝对值、不等式和方程、数列每年必考),然后以点带面,复习其它次重点的部分(比如二项式定理、比和比例)。在平时做这部分练习的时候,大家一定要开阔自己的思路,千万不要一上来就按传统的方法求解。比如有一道题是这样的:用绳子量井深,把绳子折于三折,井外余绳 5 | 4 尺,把绳子折于四折,井外余绳 1 6 | 尺,求井深?很多同学在做这道题的时候,一上来就设两个未知变量,列方程组,然后费了很长时间才把答案解出来。其实你考虑一下,当三折量井的时候,相当于余绳 3×4 = 7 | 12 尺,当四折量井的时候,相当于余绳 4×1 = 4 尺,然后口算出井深为 12 - 4 = 8 8 | 尺。初数中类似这样的题很多,常见的还有甲乙两人围绕跑道相向而行的相遇追及问题等等。通过这个简单的例子说明,大家在学初数的时候,一定要“灵活”,透过试题表面找到等量关系。 9 |   微积分这部分知识点很多,占整个数学知识点的三分之一以上,概念抽象,需要很强的抽象思维能力,并且重逆向思维(尤其体现在极值的充分性和必要性),技巧性较强,题型变幻莫测,是数学中最难的一部分,所以容易失分。建议大家在复习这一部分的时候,多做一些充分性判断题,因为一定要训练自己的逆向思维能力,只有这样才能在有限的时间内分析问题的时候做到游刃有余。还一点是要注意微积分知识点之间的相互联系,比如连续、可导、微分之间的关系,以及驻点、极值点、最值点之间的关系等。关于微积分的复习,可以按照我总结的几句话为方向进行复习,这就是: 10 |   极限是基础 ( 是建立连续、导数的基础 ) 11 |   连续是条线 ( 联系了导数与积分 ) 12 |   导数是关键 ( 概念必考,导数的应用考计算 ) 13 |   积分考计算 ( 广义积分判收敛、定积分求面积 ) 14 |   线性代数这门课知识点连贯(所有知识点都是围绕着向量的相关性展开的),概念易理解(因为这些概念都可以通过简单的例子进行说明),技巧性差(不管怎么出题,方法都是固定的),题型有核心(我们可以将每个知识点的出题形式进行归纳总结,翻来覆去就这么几种题型),所以说比较容易得分。针对线性代数的特点,我们可以这样准备复习:首先要将线性代数的知识点进行条理化,可以参看下面列的方框图(此处省略): 15 |   线性代数从内容上看纵横交错,前后联系紧密,环环相扣,相互渗透,因此解题方法灵活多变,复习时应当不断地归纳总结,努力搞清内在联系,使所学知识融会贯通,接口与切入点多了,熟悉了,思路自然就开阔了。例如:设 16 | A 是 m×n 矩阵, B 是 n×s 矩阵,且 AB = 0 ,那么用分块矩阵可知 B 的列向量都是齐次方程组 Ax = 0 17 | 的解,再根据基础解系的理论以及矩阵的秩与向量组秩的关系,可以有 r(B)≤n-r(A) 即 r(A) + r(B)≤n 进而可求矩阵 A 或 B 18 | 中的某些参数。又如,对于 n 阶行列式我们知道:若| A |= 0 ,则 Ax = 0 必有非零解,而 Ax = b 没有惟一解 ( 可能有无穷多解,也可能无解 19 | ) ,而当| A | ≠0 时,可用克莱姆法则求 Ax = b 的惟一解;对于 n 个 n 维向量 α 1 , α2 , …αn 可以利用行列式 A 20 | 的数值是否为零| A |=| α1 α2 …αn |来判断向量组的线性相关性;矩阵 A 的秩 r(A) 是用 A 中非零子式的最高阶数来定义的,若 r(A) < 21 | r ,则 A 中 r 阶子式全为 0 22 | 。凡此种种,正是因为线性代数各知识点之间有着千丝万缕的联系,代数题的综合性与灵活性就较大,大家整理归纳时要注重串联、衔接与转换。应当搞清公式、定理成立的条件,不能张冠李戴,同时还应注重逻辑性以及语言的叙述表达应准确、简明。 23 | 最后应注意几个概念间矩阵运算,比如矩阵的逆、伴随、转置等,这些关系一般出现在计算矩阵方程中。 24 |   对于概率这门课,知识点分散,知识点相互间联系较少,但公式多(可以说,概率的考试就是公式应用的考试),所以做题基本无技巧,题型相对稳定,这部分是大家最容易稳拿分的。对于概率的复习,首先要理解公式,知道公式什么时候用,用在什么地方,怎么用。在随机事件部分重点掌握条件概率公式与乘法公式、全概与贝叶斯公式,尤其对于完备事件组的概念一定要好好把握。概率的考试重点在随机变量,这部分在考分中占有相当大的比重。在随即变量中,一定要对随机变量的独立性要着重关注,因为它是很多公式成立的前提基础,如 25 | D(X + Y) = DX+DY , E(XY)=EXEY 26 | 等。还有一个需要注意的是随机变量的分布函数和密度函数,对于这两个函数一般不会出概念题,而会出问题求解题。所以大家一定要掌握它们最重要的性质:分布函数最重要的性质是极限性质,密度函数最重要的性质是归一性质,利用这些性质可以求得题干中的参数。对于考纲上规定的要掌握的 27 | 6 个常见随机变量,为方便记忆,可列表记忆: 28 |   {图片1显示} 29 |   总之,要加强综合解题能力的训练,力求在解题思路上有所突破。 MBA 30 | 试题与教科书上的习题的不同点在于,前者是在对基本概念、基本定理、基本方法充分理解的基础上的综合应用,有较大的灵活性,往往一个命题覆盖多个内容,涉及到概念、直观背景、推理和计算。许多考生往往难以适应,其突出感觉是没有思路,这正是考生考前准备应解决的突破口。考虑到数学学科的特点,要求考生自己将所有的解题思路都琢磨出来是十分困难的,这方面通常可以通过求教有经验的老师,参加有较好信誉的辅导班,或者阅读有关的辅导书解决。必须强调的是,辅导班或辅导书只是学习的一种手段,最终解决问题还要靠自己动手动脑。要充分利用一切学习机会,力求对常见的考题类型、题型、思路、特点有一个系统的把握,并在此基础上自己动手做一定数量的综合性练习题,温故而知新,不断提高自己的分析解题能力。 31 |    -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000020/18.txt: -------------------------------------------------------------------------------- 1 |  关于辅导班  【来源: 太奇MBA】 2 |   一、关于辅导班 3 |   为什么参加辅导班? 4 |   作为考研热潮的衍生物,考前辅导班一直备受关注,态度也是褒贬不一。但是和普研相比,MBA考前辅导班却显得格外重要。这是因为: 5 |   参加MBA入学考试的考生至少已工作3年,学过的知识已经忘了很多,或者已经过时。大部分考生是在职备考,没有充足的时间系统的复习,参加辅导班是迅速提高应试能力的必要手段;备考生中,很多人是非管理专业的学生,参加辅导班,在有经验的老师的指导下可迅速解惑。 6 |   如何选择辅导班? 7 |   辅导班的选择是很重要的,但由于目前社会上辅导班数目众多,鱼龙混杂,如果考友稍有不慎选择不当,不但造成财力的损失,还会影响正常的备考复习。对如何选择辅导班给出一点建议: 8 |   师资力量:辅导班的主体是老师,一个高水平的老师往往能深入浅出的讲解基础知识使学员迅速解惑;从不同的角度分析题型开拓学员思路,帮助学员顺利完成备考生活。 9 |   课程安排:有了好的老师,也要有系统合理的课程的安排。考生的基础和备考时间都是千差万别的,针对不同学员的特点进行课程设置也是对学员负责的表现之一。 10 |   办学经验:作为资深考前辅导班,它的经验也是学员们的宝贵财富。历年积累的强大学习资料库,对MBA联考走势的准确把握以及对各校招生情况的了解,对考生考入满意的学校是有极大的意义。 11 |   管理水平:一个辅导班的管理对于学员的学习也是很关键的。辅导班有义务给学员创造一种积极活跃的学习交流氛围,象太奇组织倡导的学习小组就能使学员更好的相互学习和鼓励。 12 |   口碑:目前的状况是广告满天飞,各种各样的承诺也是不觉于耳,多听听往年师兄师姐的亲身体会,对选到合适的辅导班是有更大的指导意义的。 13 |   如何发挥辅导班的作用? 14 |   选好辅导班是考生的第一步,目前MBA考前辅导班林立,使得许多人无所适从。但一条重要的参考标准是师资力量和管理服务水平。首先考生应明确这样的观念:辅导班不是万能的,它只是外部辅助条件,永远取代不了自身的努力;再就是备考期间注意做到以下几点: 15 |   提前准备。参加辅导班之前,最好能够完成一次全面的复习,尤其是数学和管理,这样才能有的放矢,带着问题去,才能达到最好的听课效果。每次上课之前,最好也能作好该课的课前预习。 16 |   不轻易缺课,认真听讲,作好笔记。辅导班的课程安排是非常紧凑的,每堂课的知识量很大,缺课之后是很难弥补的。上课尽量跟上进度,不懂的地方也要作好笔记,课后也好再思考或问老师、同学。 17 |   作好笔记整理,定期回顾。笔记的整理决不是重抄一遍,而是要根据老师的讲课脉络,理清知识架构;分析体会老师的解题思路,整理好典型例题的解题方法;并对疑难问题做进一步思考。 18 |   结合教材,作好练习。这也是非常重要的一环,可以帮助你进一步理解概念并提高实际动手能力。 19 |   如何上好MBA考试英语辅导班 20 |   众所周知,MBA联考科目中英语可谓是一只拦路虎。它既需要我们有背功,也要求我们要有足够的耐心去训练做题套路。因此,考生一般多选择英语基础、强化辅导班,一是通过听课可以督促自己学习,强压训练;二是有的考生觉得自己底子薄、基础差,希望早点动手准备,提高英语水平;三是还有部分考生出于跟风心理,认为别人都上辅导班,如果自己不上,总觉得心里没底。 21 |   尽管上辅导班的考生心态各异,但目标却是一致的:通过考试。为了能达到这一目标,我们有必要先了解辅导班的性质及作用。与常规英语课的教学不同,它是一种强化训练:时间短,信息量大,针对性强。通过上辅导班,考生可以明确考点与往年相比较大的变动:淡化语法,加强读写运用。同时,辅导老师还根据当年特点,有效的突出复习重点,训练针对性强的复习方法及做题技巧。 22 |   既然辅导班的重点在强化训练上,那么就要求广大考生在上辅导班之前做到有备而来,这样才能充分发挥听课的作用。 23 |   首先,储备一定的词汇量。考生在听课之前应量熟悉它们。这是关系上辅导班是否有良好效果的重要因素这一,否则边听课边背单词,不仅跟不上老师的进度,还会影响到自己的信心。当然这几千个单词在上课之前不一定要求全部会认会写,只要求能够盾到它就想起它的词义就可以了,对于那些重点的常考词,老师在课上会专门强调的。背单词是一个漫长的过程,绝非在一段时间就可以解决的,它应贯穿整个备考的始终。 24 |   其次,巩固基础语法知识,加强语法在析句方面的应用。在英语言中,单词就像棋子,而语法则如下棋规则。中国人从来就不畏语法考试,因为以前的英语考试中我们多是背规则,练规则,考规则。出题人不考类似“像棋中马应该怎么走“的规则问题,而是把整个棋局摆在考生面前,让考生自己按照规则走。它不仅要求考生对基础语法知识的全面掌握,更加注重语法在句子、文章中的运用。因此,考生在全面了解语法基础知识之后,重点应放在长、难句的结构分析上,长、难名既然是阅读理解的基础,也是英语泽汉考查的实质性内容。 25 |   如果你已经做好了上面几项准备工作,那么再来上辅导班无疑是有备而来,有的放矢了,这样听课的收获远远超过了那些毫无准备的考生。但是由于辅导班时间集中、强度大,致使许多考生容易产生松懈的情绪,或是不能坚持听课或是完全被动地跟随着老师走,把这段时间的学习完全交到了老师手中,这些作法都直接影响到听课的效果。此外,课后的巩固是备考中不容忽视的环节。听课期间由于上课占用大部分的时间与精力,因此总要注意少而精的原则:不要马上开始大量做试题,复习重点应放在听课笔记上。下课要趁热打铁,及时复习课堂笔记,体会老师上课的做题技巧,并且利用真题进行个别专项操练。例如,课上老师讲到阅读理解中选项的分类:主旨题与细节题及它们分别有哪些标志词,那么在课后复习中,我们就可以拿出一、两套真题单独分析选项,而无须多花时间去读原文、做题,这样复习训练,目的更明确,花费时间也不会太多,而又能达到事半功倍的效果。辅导书的选择  二、辅导书的选择: 26 |   参考书的选择——与其博览群书,不如精读一本 27 |   在MBA的参考书市场上,每科都有几本由名师编写的“经典”。这在有关MBA的网站上都可以看到,网站还有网上售书业务。参考书用这些通用版就可以。其实,只要是有一定名望的参考书,基本上都可以涵盖全部知识点,在所选题目、答案解析方面都可以满足要求。参考书的选择是复习前要做的重要准备工作,它不仅关系到复习进度的快慢和掌握的效率,更重要的是对你的解题思路的影响,因为在数学做题中,技巧很关键,在MBA考试中,应该在75分钟左右完成25道题目。问题求解14道题,每题3.5分钟,49分钟;充分性判断11道题,每题2.5分钟,27分钟。根据多年测算经验,如果不能保证2.5与3.5这个数学“黄金时间点”综合考试肯定完不成(其中包括了运算过程中“意外出错”的改正时间)。所以说“挤时间”成为重中之重,如何挤时间只能靠熟练的基本概念掌握与纯熟的解题技巧。所以大家在平时做题中,一定要养成良好的解题习惯,提高解题速度。下面就大家不同的数学基础层次来推荐不同的参考书目。 28 |   (1)基础较差,没学过数学,或者工龄很长,学过的知识大部分遗忘了的考生。对于这种零基础的情况,数学要分科复习,一科一科的突破。数学包括四科,即初等数学、线性代数、微积分和概率。对于初数,可参看高等教育出版社出的高中代数书,它分为上下册,大家可以参看里面的针对MBA考试的不等式和方程,绝对值和数列部分。这些部分讲的比较浅显易懂,适合大家建立初数基础。建议大家在看书的时候,一定要把课后的习题做一下,千万不要一看自己会做了就不去做了,切记眼高手低是复习的致命陷阱。线性代数和概率可以参看大学本科文科专业的通用教材,比如参看人大或高等教育出版社出的教材,重点要把向量(组)的线性关系看透,否则后面的齐次和非齐次线性方程组解的结构就不易理解。微积分大家可参看同济大学出版社出的高等数学上下册,这也是大学本科的通用教材,主要把上册内容好好看看,因为下册讲的都是多元函数,多元函数不是考试重点,其中把与MBA相关的知识点好好看看,对复习很有帮助。概率的复习难点在于古典概型,其中涉及概念一定要好好理解,复习重点和考试重点在于随机变量,这部分公式很多,所以大家在复习的时候一定要在理解的基础上把公式记熟练。 29 |   (2)基础一般的考生。这类考生占大多数,大家在复习的时候可参看机械工业出版社出的MBA 数学辅导书,这也是按照考试指导委员会制定的大纲进行编排的。这本书知识点归纳清晰,例题讲解详细,练习面面俱到,难度与真实考题难度基本一致,很适合有初步基础的考生提高成绩。这本书最后附有模拟题,大家在复习完后可以检验一下自己复习掌握的程度。当你把这本书看完后,你接下来可以看看奇迹230分这本书,这本书的习题综合性比较强,适合大家考前强化冲刺使用。这两本书大多数书店都有销售,这也是所有备考MBA必备的辅导书,因为每年的考题都能从其中找到出题的影子。 30 |   (3)基础很好,想取高分的考生。对于这类好生,既然复习的很扎实,掌握的很牢固,可以参看一下普研的参考书,普研的数学四与MBA考试接近,大家可以将与MBA相关的题做一下,这对数学复习是大有裨益的。但也没有必要追求太深太难的题目,MBA数学还是侧重对基础的考察。 31 |   总之大家在复习的时候一定要围绕一个原则:一定要始终以机工版教材为核心,因为这本教材为MBA指导委员会唯一指定的全国统编教材,在本书中都能够找到历年真题的“影子”,这本书的难度与考试难度相当吻合,且重点突出,思路清晰,例题典型,建议考生做2-3遍。大家在复习中要注意,关键在于如何用这些书。参考书不能贪多,我觉得,每科有一至两本即可。选定了这主要的一两本书后,就要充分利用,把书读透;如果时间充裕,看两三遍最好。每本书都有自己的体系,与其博览群书,不如精读一本。往年的考题是最好的复习资料,当你将知识点都复习完的时候,可以做做历年真题,从中可以把握命题思路和答案的组织方式。 32 |   但是,从许多考生经验来看,只复习这一套书还是远远不够的,恰当的选择其他的辅导书还是很有必要的。 33 |   2  -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000020/19.txt: -------------------------------------------------------------------------------- 1 |   1.考生填报志愿采取网上填报方式,考生须在规定时间内登录北京教育考试院网站填报志愿,网址为www.jeea.cn/ 或gk.bbn.com.cn/ 。同时提供电话填报方式,考生可通过拨打声讯电话1606790填报志愿或查询志愿。 2 |   2.考生填报志愿,要严格按照《2006年全国普通高等学校在京招生专业目录》填写信息。 3 |   3.考生填报志愿时,宜先草拟一份志愿表,内容包括考生的考生号和要填报的院校代码及名称、专业代码及名称,以保证填报志愿的准确和填报过程的顺利。 4 |   4.考生在网上报名阶段设定的密码作为网上填报志愿的初始密码。在第一次填报志愿之前将开通系统供考生修改密码,考生必须修改密码才能进行志愿填报,考生需牢记修改后的密码,凭此密码进行第一次志愿填报、第二次志愿填报和各批次志愿补报。如考生忘记密码,须在系统开通的日期内携带本人身份证到本报名单位登记申请恢复密码。 5 |   5.在第一次志愿填报时同时采集考生特征,考生特征的主要内容为照顾对象,具备相关特征的考生须参加第一次填报。考生在选中相应选项后必须向报名单位提供相关证明材料方为有效。 6 |   6.第一次填报提前批、本科一批、本科二批、本科三批的志愿及艺术类高职录取院校的志愿,提前录取院校可选报两个志愿学校,第一批、第二批、第三批录取院校可在本批内各选报三个志愿学校,艺术类高职可选报两个志愿学校,每个志愿学校可选报五个专业。 7 |   7.第二次填报专科录取批次的志愿,可选报四个志愿学校, 每个志愿学校可选报五个专业。 8 |   8.今年继续实行公布批次未完成计划重新征集志愿再行录取的方式。在本科一批、本科二批、本科三批和专科批次的正式志愿录取结束后,如高等学校计划未完成,将公布未完成计划,重新征集考生志愿再行录取。 9 |   在每个批次的志愿补报期间,达到相应批次录取控制分数线且未被录取的考生可补报相应批次未完成招生计划的院校和专业志愿。录取期间各批次未完成计划的院校和专业信息请参照北京教育考试院网站或媒体宣传。 10 |   本科各批次补报志愿可选报三个志愿学校, 每个志愿学校可选报三个专业。专科批次补报志愿可选报四个志愿学校, 每个志愿学校可选报三个专业。 11 |   补报志愿在录取时按照“分数优先,从高分到低分,按志愿顺序”一次性向招生学校投档,由招生学校审查录取。 12 |   9.电话填报必须使用北京市固定电话操作,且务必使用音频电话。 13 |   10.志愿填报日程安排 14 |   5月 9日 8:00—5月12日 8:00 15 |   系统开通供考生修改密码 16 |   5月12日8:00—5月17日18:00 17 |   第一次志愿填报 18 |   7月31日8:00—8月 2日18:00 19 |   第二次志愿填报 20 |   预计7月14日(以录取期间公布的为准) 21 |   本科一批志愿补报 22 |   预计7月21日(以录取期间公布的为准) 23 |   本科二批志愿补报 24 |   预计7月27日(以录取期间公布的为准) 25 |   本科三批志愿补报 26 |   预计8月 7日(以录取期间公布的为准) 27 |   专科批次志愿补报 28 |   网上填报志愿步骤 29 |   通过浏览器登录www.bjeea.cn/ ,点击“网上报名”,然后点击“2006年北京市普通高等学校招生网上志愿填报”进入系统,或者直接登录gk.bbn.com.cn/ 进入系统; 30 |   点击“修改密码”修改自己的密码; 31 |   点击“提交志愿信息”,输入考生号、密码和校验码,点击“确定”进行登录进入志愿填报页; 32 |   有关考生填报考生特征; 33 |   填报院校志愿和专业志愿,在院校框中输入3位院校代码,在专业框中输入2位专业代码(输入代码后会显示相应院校名称和专业名称),并选报是否服从专业调剂和是否愿意走读; 34 |   点击“提交”完成志愿填报。 35 |   声讯电话填报流程 36 | 37 | 38 | 39 | 40 |   编辑:苏琳 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000022/10.txt: -------------------------------------------------------------------------------- 1 |   新华网深圳3月3日电(记者贾文军)全国拳击锦标赛3日在深圳市龙岗体育中心拉开战幕,在接下来的一周里,来自全国各地的200多名拳击健儿将在这里展开角逐。 2 | 3 |   本次锦标赛由国家体育总局拳击跆拳道运动管理中心主办。比赛设置了51公斤、57公斤、64公斤、75公斤和91公斤5个级别,全国各地共有45支代表队参赛。 4 | 5 |   此前,中国拳击队已经在深圳进行了3个月的冬训。国家体育总局拳击跆拳道运动管理中心副主任崔富国表示,要通过这次比赛来检验冬训的成果,也要根据比赛成绩为2008年北京奥运会选拔优秀人才。 6 | -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000022/11.txt: -------------------------------------------------------------------------------- 1 |   《看今天》两会特别报道已经开始启动,两会和我们每个人的生活息息相关,让我们一同关注两会。您最想跟两会的代表委员说些什么?您有什么问题和建议想告诉他们?您可以拨打《看今天》的热线电话:010-51005100,也可以在搜狐网的两会专题上留言,《看今天》栏目组将搭起你和两会代表委员之间的桥梁。(注:以下问题主要面对北京网民,如果您是外地网友,请注明你所在的地域) -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000022/12.txt: -------------------------------------------------------------------------------- 1 |   2006年2月25日北京,香港利苑饮食集团在京开办的第一家食府—北京利苑酒家,在位于王府井金宝街的金宝大厦内隆重开业,此次开业标志着香港利苑饮食集团首次将目光聚焦北京。 2 |   利苑酒家是近年来进驻北京历史最悠久的粤菜食府之一。自1973年在香港九龙开办第一家店以来, 利苑集团在饮食界已拚搏近30余年,旗下拥有13所酒家, 遍布香港、中国大陆、新加坡, 凭借着雄厚的实力, 各家店均屡获殊荣。1992年至2006年,新加坡利苑酒家连续24年荣获《Singapore Tatler》新加坡最佳食府之一;而香港利苑酒家则荣获《Hong Kong Tatler》2006年度香港最佳食府称号;2005年,利苑酒家被评为香港资本杰出行政品牌。 3 |   此次进驻北京,利苑在酒家的装潢与菜品烹制上煞费苦心。投资三千五百万元,特地邀请了的著名意大利裔设计师Hernan . Zanghellini为北京利苑进行设计,他曾经为香港多个著名的高级餐厅及会所提供设计。北京利苑囊括了中、西方传统与现代特色,充分满足顾客的各种需要。而独具利苑特色的16间贵宾厅房设有配餐间与洗手间,它们的独立设计也是十分精巧,既保证了菜品最大程度的鲜美又为宾客提供最便捷的服务。酒家的装饰也是匠心别具,每一个小小的饰物都是酒家费心竭力挑选、订做的。餐桌上每一盆花都是邀请香港著名插花大师,绿芷花艺公司(Green Finger)的陈庆让先生到京专程花费数天时间制作而成;酒家中每一件陈设都是费尽心思,四处搜罗精选而来;就连小小的餐具衬盘也是按照每一贵宾室不同的风格量身定做, 设计精美, 身价不斐。 4 |   此外,素有香港“饮食界少林寺”之称的利苑集团,在陈主席“先教做人,后教做事”的经营理念下,坚持以健康的原料、精湛的烹饪方法为顾客提供高贵、正宗的精美粤式菜品; 将食物最自然的颜色、最鲜美的味道搭配在一起,充分将食物最鲜美的一面展现在顾客面前,并不断对菜式进行创新,三十年来创出上千款菜式,将中国及世界各地食物的精华,融入传统粤菜之中,菜式千变万化,成为新派粤菜的佼佼者。北京利苑更是潜心研究“南菜北做”,坚持使用来自原产地的原料,保持食物最正宗的味道,使菜品既有传统粤菜的鲜美又更加符合北方顾客的口味;并且专程从香港、广州等老店调配经验丰富的优秀服务人员为北京店近200名员工进行培训;更是将高端科技运用到酒家经营当中,每个贵宾室均配有无线上网设施,最大限度地为客人提供方便,而点餐所用的电脑系统更是容纳了1万余种不同选择,满足每一位客人对菜品的特殊要求;尽力为顾客打造一个优雅、舒适的高品质的用餐空间。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000022/13.txt: -------------------------------------------------------------------------------- 1 |   留守人士自我安慰:在北京过春节的十理由 2 |   www.XINHUANET.com2006年02月01日 20:00:35来源:新华网 3 |   【字号:大 中 小】 【背景色 】 【留言】 【评论】 4 |   过年留守北京这个决定英明 在北京过年的十大理由 5 |   难道真的是“非副刊”前不久那期“有钱没钱咱都回家过年”造的孽吗?这几天,当汹涌人潮涌向首都国际机场、北京站、北京西站、北京南站、北京北站(请问北京还有别的站吗)时,我们感到了一丝恐慌。 6 |   一想到瘦小的我将于今晚被装进那个绿皮儿临时加车里并将颠簸14个小时,一种强烈的愿望纠缠了我:真想不走了,留在北京过年! 7 |   是的,如果你不回家过年,那你可能会变成一个不孝子,因为老爹老娘正盼着你常回家看看。但是,你已经没法回去了,那就别折磨自己了,春节到来前一天,“非副刊”推出十大理由,帮助留在北京过年的你做到心安理得。 8 |   理由一,省旅途劳顿。这些劳顿包括——半夜三更去火车站搏票的麻烦;和讨厌的同事赔笑脸以便说服人家替你值班的麻烦;坐完飞机坐火车、坐完火车坐汽车、坐完汽车坐牛车的麻烦。省去这些麻烦后,你只需猫在自己的小窝里,坐看窗外风生水起、风云变幻就可以了。 9 |   理由二,省钱。科技意味着花很多钱让事情变得简单,然而回家却意味着花很多钱让事情变得麻烦。我的同事苏三去西站的人潮人海中花了700多块钱买了一张高价硬卧票;我的领导花2000元买到一张去长沙的飞机票,他将有生以来第一次坐头等舱,因为售票员说,这是年前最后一张飞长沙的机票,你要不要;诚然,我的火车票只花了33块(我说过是加车),但这并不意味着我不需要为回家而肉痛,我有四个亲侄子三个亲外甥,我两个表嫂一个表姐也都赶在我回家前生了孩子。你知道,这年头,红包里不装个百八十块,根本拿不出手。 10 |   理由三,感受北京的交通畅通!你知道,这是你做梦都在企盼的情景啊。当百万雄师过大江的时候,江的这边立马清静了下来。所以,当百万外地人返乡过年的时候,整个北京城也会刷地清静下来。那时,北京有极为宽阔的马路,想想看,那么宽的路上只有你等少数几个或者几辆车在溜达,多气派啊。 11 |   理由四,睡觉。如果不回家,你完全可以关掉手机大睡七天没人干涉! 12 |   理由五,为了你的牵挂——你的花,你的鸟,你的猫,你的狗,甚至为了你厨房里的小强。如果回家过年,你会像我一样忍受与爱犬分别的痛苦,你厨房里的小强也会因为找不到充足的口粮饥饿而死。想给它们打个慰问电话吧,可人家又不会说话。如果在北京过年,就可以和它们长相厮守了。 13 |   理由六,为了小偷。当然,我不是指和小偷长相厮守,我指的是避免小偷在你回家过年的时候光顾你的小窝。即使你像我一样穷吧,想想看,小偷先生坐在你的马桶上,看着别人写给你的情书,吃着你积攒的零食,肯定会让你很不爽的。 14 |   理由七,为了你的健康。你不用被爹娘拽着给你大姑去拜年,也不用被同学拽去通宵搓麻,他们不知道你颈椎不好,医生说过汽车急刹车的话,别人没事,你的脖子就有可能断掉。你也不必被拉着去和N年不见的中学同学应酬,听人家吹牛你不爽,看人家带着漂亮的女友你不爽。 15 |   理由八,真正感受一把北京这个和你息息相关的城市。你知道,春节期间,北京大大小小的庙会很多的。老北京的民俗集中展示在你眼前(有关这项,请看B06-B09的庙会专版)。想想看,上午到商场积分凑返券,下午逛庙会看燕子李三、大刀王五们表演,时而来串糖葫芦,时而来坨棉花糖,很有味道呢。 16 |   理由九,省去离愁别绪。你知道这样说很不孝,但是你娘总是这样说:“不回来也罢了,回来后又走掉,娘心里头难受啊。”为了让娘少些离愁,干脆把路费钱省出来寄给你娘吧。 17 |   理由十,没有理由,因为你是北京人。如果你是北京人,干吗不舒舒坦坦地呆在北京呢?啥时候外出旅游不行啊,偏偏赶这个挤死人不偿命的春运高峰?!何况,北京也可以放鞭炮了,你还可以去京郊农家小院小住几天,你可以去延庆泡温泉,可以去密云滑雪…… 18 |   最后,无论你因为哪种理由留在北京过年,你都是值得羡慕的。那些正在火车上颠簸的人,他们此刻所渴望的幸福,正是你现在所拥有的。所以,珍惜吧,兄弟。至于你对家的思念,他们会帮你带到的。 19 | 来源:华夏时报 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000022/14.txt: -------------------------------------------------------------------------------- 1 |   大学生小袁网上投简历求职,一家自称设在广东的跨国公司分公司很快就打来电话进行“面试”。然而小袁查询该公司在上海的总部得知,他们没有在广东设立分公司,也没有在广东进行招聘。警方提醒,这很可能是个骗局。 2 |   小袁是在一知名人才网站上发出电子简历的,令小袁意外的是,简历没投几天,就有一家比较知名的半导体跨国公司给自己打来电话。一位姓曹的女士告诉他,公司现在正要 3 |   引进一批毕业生,年前就到岗培训,询问小袁有没有去的意向。欣喜若狂的小袁当即就同意了。1月15日,对方煞有介事地给小袁进行了电话招聘面试。三天后,小袁接到电话通知面试通过了,于1月22日到广东东莞体检、复试。 4 |   据小袁所知,这家半导体公司好像是在上海,而对方让去东莞复试,他有点纳闷。曹女士解释说,公司要在东莞设立分点,亟待一批相关专业的大学生加盟。随后,她又把公司丰厚的工资、住房待遇向小袁作了一番介绍。 5 |   小袁动心了,1月17日他来到火车站,准备预订到东莞的车票。由于没有直达车,到广州的票也没有了,他只好又回到了学校。此时,冷静下来的小袁才感觉事情有点不对劲。随后,他上网搜索了这家公司的详细资料,发现只有上海总部在发布招聘启事,其他地方根本就没有设立分公司。东莞的114也根本查不到这家公司的电话。 6 |   随后,小袁拨打了东莞110报警电话,当地民警告知这很可能是个骗局。此前就有不少急于找工作的大学生,被不法分子骗进传销窝点。 7 |   (来源:北京人才市场报) -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000022/15.txt: -------------------------------------------------------------------------------- 1 |   讲述:我网上求职险遭名企骗局 2 |   http://www.sina.com.cn 2006年01月28日10:31 3 |   大学生小袁网上投简历求职,一家自称设在广东的跨国公司分公司很快就打来电话进行“面试”。然而小袁查询该公司在上海的总部得知,他们没有在广东设立分公司,也没有在广东进行招聘。警方提醒,这很可能是个骗局。 4 |   小袁是在一知名人才网站上发出电子简历的,令小袁意外的是,简历没投几天,就有一家比较知名的半导体跨国公司给自己打来电话。一位姓曹的女士告诉他,公司现在正要 5 |   引进一批毕业生,年前就到岗培训,询问小袁有没有去的意向。欣喜若狂的小袁当即就同意了。1月15日,对方煞有介事地给小袁进行了电话招聘面试。三天后,小袁接到电话通知面试通过了,于1月22日到广东东莞体检、复试。 6 |   据小袁所知,这家半导体公司好像是在上海,而对方让去东莞复试,他有点纳闷。曹女士解释说,公司要在东莞设立分点,亟待一批相关专业的大学生加盟。随后,她又把公司丰厚的工资、住房待遇向小袁作了一番介绍。 7 |   小袁动心了,1月17日他来到火车站,准备预订到东莞的车票。由于没有直达车,到广州的票也没有了,他只好又回到了学校。此时,冷静下来的小袁才感觉事情有点不对劲。随后,他上网搜索了这家公司的详细资料,发现只有上海总部在发布招聘启事,其他地方根本就没有设立分公司。东莞的114也根本查不到这家公司的电话。 8 |   随后,小袁拨打了东莞110报警电话,当地民警告知这很可能是个骗局。此前就有不少急于找工作的大学生,被不法分子骗进传销窝点。(文/) 9 |   (来源:北京人才市场报) -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000022/16.txt: -------------------------------------------------------------------------------- 1 |   大学生求职供求不匹配凸显 2 |   2006年,大学毕业生求职面临的最大障碍是供求不匹配。前程无忧最新发布的调查显示:月薪1000元已成为毕业生的求职底线;七成以上企业认为2005届毕业生在工作中表现平平,缺乏责任感、不愿吃苦和环境适应能力差成为毕业生的致命伤。 3 |   本次调查覆盖国内27个省市40所重点大学的5.8万名应届毕业生,访问涉及33大行业的5800家企业。在受访企业中,3515家计划今年再次招聘毕业生。其中3108家提出明确招聘人数,提供空缺职位6——6.5万个,比上年增加了三分之一。但大量招聘毕业生的企业并不多,计划招聘超过100人的企业只有148家,不足5%。 4 |   调查还发现,民营企业已成为就业机会的最大提供者,提供的收入水平已接近外资企业。1169家民营企业计划招聘2.8——3万名毕业生,超出了外企2.2——2.3万名的人才需求。 5 |   2006应届毕业生最愿意工作的地区是上海、北京和广东,其次为浙江省和江苏省。毕业生都把“经济发达、机会多、平均收入比较高”,作为选择工作地区的第一标准。 6 |   热门行业供求不对称 7 |   大学生求职中的供需矛盾,不只体现在数量和排行上,由于知识、能力不匹配,企业对能否招到合适的大学生表示“不乐观”。 8 |   调查显示,计划招聘毕业生最多的五大行业分别是:计算机、电子技术、快速消费品、生物制药和房地产,需要人数3.8——3.9万个。而毕业生愿意投身的前五大行业依次为:通讯电信、金融证券、计算机、互联网和贸易。 9 |   在通讯电信行业,招聘规模和收入增长都在收缩,人才需求数位列第13位。传统的固网运营人才比重已经偏高,新兴的3G、NGN、IPTV等方面的技术人才稀缺,企业更愿意招聘硕士和博士毕业生。 10 |   在计算机和电子技术行业,企业招聘毕业生主要从事技术研发和技术应用,对知识专业度要求很高。如Intel计划全国招聘500人,主要考虑硕士以上应届毕业生,本科生求职之路并不乐观。 11 |   金融证券人才一直是人才市场的热门。但金融证券行业目前主要急缺业务人员和高层次的经营管理人才,企业通常只招两三名应届毕业生作为人才储备。 12 |   而需求旺盛的快速消费品和批发零售行业,在毕业生愿意从事的行业排名中分列第15和第24位,生物制药行业列第19位,愿意在保险业工作的学生仅有721人,列倒数第三。 13 |   大量销售职位无人问津 14 |   销售是企业收入最为倚重的职能,可是满腔抱负的学生多数不愿从事。据说有保险公司到一家重点大学联系校园招聘会,就业指导办公室的老师直接劝企业放弃,没有毕业生愿意做保险业务代表。 15 |   调查发现,企业最缺销售人才,提供空缺职位2.96——3.03万个;其次是技术研发和应用8770——9480人;再次是生产制造和工程、工艺设计和市场广告等方面的人才。3515家计划招聘2006应届毕业生的企业中,2866家有意让毕业生做销售工作;148家招聘规模超过100人的企业,95%以上招聘毕业生担任营销职能。 16 |   但毕业生愿意从事的工作职能前五位分别是:技术研发、市场广告、人力资源管理、贸易采购和行政后勤,愿意从事销售的人数排在第八位。 17 |   调查分析,很多毕业生认为销售工作要看人脸色,刚毕业没有社会关系和销售渠道,往往累得半死还赚不到钱。也有学生认为,做销售技术含量低,不稳定也不体面。有意思的是,不少学生愿意从事外贸工作,认为它和一般销售不同,不仅收入可以较快提高,还可以接触到国际公司。 18 |   最为尴尬的可能要属生物制药行业。很多跨国企业都想招聘大学毕业生,培养和储备销售人才。但很多医学院的毕业生表示宁愿在小医院拿低工资,也不想到跨国公司任医药代表。 19 |   对此专家表示,没有比销售工作更能培养人的意志品质和沟通交往能力了。中国服务业需要一大批兼具专业知识和技能的营销人才,一个汽车高级销售经理的年薪约50万元,优秀的保险业务代表年薪可达百万元,但这样的人才往往有价无市。 20 |    21 | 22 | 23 | 24 | 25 | 26 | 计划招聘应届毕业生最多的前八大行业 27 | 28 | 应届毕业生愿意从事的前八大行业 29 | 30 | 31 | 毕业生收入预期(上)和企业给付水平(下)的比较 32 |     33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000022/17.txt: -------------------------------------------------------------------------------- 1 |   大学生小袁网上投简历求职,一家自称设在广东的跨国公司分公司很快就打来电话进行“面试”。然而小袁查询该公司在上海的总部得知,他们没有在广东设立分公司,也没有在广东进行招聘。警方提醒,这很可能是个骗局。 2 |   小袁是在一知名人才网站上发出电子简历的,令小袁意外的是,简历没投几天,就有一家比较知名的半导体跨国公司给自己打来电话。一位姓曹的女士告诉他,公司现在正要 3 |   引进一批毕业生,年前就到岗培训,询问小袁有没有去的意向。欣喜若狂的小袁当即就同意了。1月15日,对方煞有介事地给小袁进行了电话招聘面试。三天后,小袁接到电话通知面试通过了,于1月22日到广东东莞体检、复试。 4 |   据小袁所知,这家半导体公司好像是在上海,而对方让去东莞复试,他有点纳闷。曹女士解释说,公司要在东莞设立分点,亟待一批相关专业的大学生加盟。随后,她又把公司丰厚的工资、住房待遇向小袁作了一番介绍。 5 |   小袁动心了,1月17日他来到火车站,准备预订到东莞的车票。由于没有直达车,到广州的票也没有了,他只好又回到了学校。此时,冷静下来的小袁才感觉事情有点不对劲。随后,他上网搜索了这家公司的详细资料,发现只有上海总部在发布招聘启事,其他地方根本就没有设立分公司。东莞的114也根本查不到这家公司的电话。 6 |   随后,小袁拨打了东莞110报警电话,当地民警告知这很可能是个骗局。此前就有不少急于找工作的大学生,被不法分子骗进传销窝点。 7 |   (来源:北京人才市场报) -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000022/18.txt: -------------------------------------------------------------------------------- 1 |   大学生小袁网上投简历求职,一家自称设在广东的跨国公司分公司很快就打来电话进行“面试”。然而小袁查询该公司在上海的总部得知,他们没有在广东设立分公司,也没有在广东进行招聘。警方提醒,这很可能是个骗局。 2 |   小袁是在一知名人才网站上发出电子简历的,令小袁意外的是,简历没投几天,就有一家比较知名的半导体跨国公司给自己打来电话。一位姓曹的女士告诉他,公司现在正要 3 |   引进一批毕业生,年前就到岗培训,询问小袁有没有去的意向。欣喜若狂的小袁当即就同意了。1月15日,对方煞有介事地给小袁进行了电话招聘面试。三天后,小袁接到电话通知面试通过了,于1月22日到广东东莞体检、复试。 4 |   据小袁所知,这家半导体公司好像是在上海,而对方让去东莞复试,他有点纳闷。曹女士解释说,公司要在东莞设立分点,亟待一批相关专业的大学生加盟。随后,她又把公司丰厚的工资、住房待遇向小袁作了一番介绍。 5 |   小袁动心了,1月17日他来到火车站,准备预订到东莞的车票。由于没有直达车,到广州的票也没有了,他只好又回到了学校。此时,冷静下来的小袁才感觉事情有点不对劲。随后,他上网搜索了这家公司的详细资料,发现只有上海总部在发布招聘启事,其他地方根本就没有设立分公司。东莞的114也根本查不到这家公司的电话。 6 |   随后,小袁拨打了东莞110报警电话,当地民警告知这很可能是个骗局。此前就有不少急于找工作的大学生,被不法分子骗进传销窝点。 7 |   (来源:北京人才市场报) -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000022/19.txt: -------------------------------------------------------------------------------- 1 |   20位网友领到免费回家机票 2 |   自从Qunar与搜狐、天益游网站合办“夺宝奇兵”的活动以来,已经有好多人中得免费机票,其中有二十位已经定好回家的机票,时间就在临近春节之前。为了让大家能够轻松愉快的领到机票,Qunar和天益游决定把领票地点放在咖啡店,让大家既可领到免费机票,又可以享受到咖啡的浓香,让活动至始至终有个完美的诠释。 3 |   上周五晚上六点多钟,中奖人陆陆续续来到领奖现场,在Qunar几个工作人员的组织下,由去哪儿旅游搜索引擎合伙人庄臣超和天益游总经理谭治国把机票发到每位中奖人手中。先来的惊诧,后来的惊讶,大家都没想到有这么多中得大奖的人可以拿到年前的免费机票。其中有好几位家离北京都很远,家在贵阳、兰州、重庆、广州的都有,每次都挺害怕过年,而今年他们不再为此而担心了。当大家听到还有到机场的免费接送时,不由得发出欢乐的笑声。 4 |   活动很快结束了,大家留下合影,也回去了。对某些人来说这一刻已经在记忆中消失,而对于某些人来说,这一刻刻骨铭心! -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000023/10.txt: -------------------------------------------------------------------------------- 1 |    从今天的影响来看,2004年创立的"数字炼金馆"无疑是"数独"兴起历程中一个标志性事件,尽管它当初不过是数独天才们互相诘难的产物。  随着不断有更多的数独爱好者向他们提问,"数字炼金馆"认为有必要精炼"数独"题的篇目,以原创的经典题目让更多数独迷得到打开数字迷宫的快乐,而不是被垃圾题目弄得晕头转向。  现在,68%的数独迷只做《疯狂数独》的题目,因为,它意味着更多的原创、更多的经典、更多的快乐、更多的疯狂。  数独(Sudoku)是目前风靡全球的一种数字游戏,其概念源自两百年前盲眼的瑞士数学家欧拉发明的"拉丁方格"的游戏。但数独一词来自日文(すうどく),是由"数"和"独"两个词组成,这一游戏完全适合当今这个以游戏为乐事的时代,而且数独游戏无需翻译就能跨越一切国界。  这种游戏令很多人为之痴狂,而且同步席卷了整个世界。英国几乎所有的报纸都刊登了数独游戏,甚至还进了黄金时间的电视节目里;从澳大利亚到克罗地亚,从法国到美国,各家报纸杂志纷纷刊登这种填数游戏,日本人每月购买的数独杂志超过60万份,《纽约时报》甚至考虑将数独与其备受推崇的纵横字谜一同纳入在周日刊上;网络上的数独游戏数不胜数,人们甚至可以将它下载到手机上。有人预言,数独可能会重演20世纪80年代全球人手一个"魔方"的盛况。  人们在推究数独热的原因时,首先想到的是很多国家的人本来就喜爱玩拼图游戏;再者,数字具有神奇的属性,数的性质让无数数学大师痴迷,很多举世闻名的数学难题都是数论问题。  当然,数独的流行还有深层次的原因,在3D游戏、网游等各种高级游戏越来越华丽、玩法越来越复杂的今天,如同其他很多越来越复杂的新事物一样,新游戏已经丧失了简单游戏的很多优点。然而,数独由于规则简单,却变化无穷,在推敲之中完全不必用到数学计算,只需运用逻辑推理能力,所以受到老少男女的喜爱。  数独也许算不上刺激,但非常有趣,似乎思路被卡住了,却突然之间推敲出某个数字,从而成功地解出答案,由此而生的满足感棒极了。这是一个从混乱中理出头绪的游戏,能够在不确定的生活里,随时拥有如此简单且立即的"惊喜",总是令人心情愉快的。  在中国,《疯狂数独》作为数字炼金馆的原创经典,引领了数独爱好者的疯狂,数独在中国即将掀起一阵数字游戏的狂风,迅速中小学生手中风靡起来,随之成为众多青少年和都市白领为之痴迷的智力、娱乐游戏。人手一册《疯狂数独》,考验和你智力和能力,挑战数独的极限境界。  出版社:中国三峡出版社  出版时间:2005年10月  定价:20元   共找到20,159,004 2 | 个相关网页. -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000023/11.txt: -------------------------------------------------------------------------------- 1 |    由文物出版社出版的《中国大史记·传世邮币珍藏》26日在故宫太庙举行了首发式。据出版方介绍,这套图书创造了中国出版界的六个第一,一问世便吸引了足够的眼球。  据介绍,《中国大史记·传世邮币珍藏》共收藏了100枚中国古代钱币珍品和722枚邮票真品,根据不同历史朝代的更替,分为八卷。每卷 图书除收录相对应时期的邮票与古币外,还设有“历史故事”、“中国大事记”、“世界大事记”、“历史小百科”四大文字版块,使五千年中华历史风云更加立体、深入地呈现在读者面前。这样厚重的安排使得本书创造了多项中国出版史上的六个第一,一出世而惊四座,成为今年出版界最引人瞩目的图书之一。  这六项第一是:  ——最全,是第一部不断代的以中国古钱币和邮票实物佐证历史的大全;  ——最多,收藏的古钱币和邮票珍品总数多达800多枚,任何其他同类图书都难望其项背;  ——最早,古代钱币从4000多年前我国最早的原始货币“贝币”开始,到骨贝、“蚁鼻钱”、秦半两、“一化”、刀币等珍稀古币一路沿承,直至清朝最后一枚方孔圆钱——宣统通宝,邮票则包括中国1888年出品的第二枚邮票“小龙票”;    ——材质最丰富,除金币外的所有钱币材质,如天然贝、骨、铜、铁、铅锡、银、镍均有收藏;  ——最珍稀,如远古的贝币、刀币、布币,中国第二枚邮票“小龙票”、数十枚“文革”时期邮票和老纪特票等;  ——最少,全国仅发行2000册,决不再版,也不可能再版。  《中国大史记》是翰墨林公司酝酿、筹备多年、积钱币学专家、历史学家、设计大师、策划大师之力,经过三年准备、一年制作之功所得。书中收录的所有钱币和邮票均经相关权威部门鉴定为真品。  当目睹这些锈迹斑驳、饱经历史沧桑的古钱币,中国5000年来的文明进程、社会兴衰、王朝更迭乃至经济的起落跃然于眼前。从秦皇汉武到唐宗宋祖,从春秋战国到隋唐明清,直至光绪民国。历史不再是尘封的典籍,从此鲜活生动起来;当七百余枚邮票成为中国上下五千年历史的形象载体,就获得了前所未有的冲击力,讲述着中国数千年的历史,展示着中华灿烂文化,直观地表现了中华文明前进的脚步。  正是由于这六个出版界第一,该书策划人饶声勇在首发式上自豪地说,文明的脉搏、文化的回声、文物的绝唱,薪火相传,百世一系,尽汇《中国大史记》。  原人大常会副委员长布赫,文化部副部长郑欣淼,国家文物局博物馆专家组组长、中国博物馆学会理事长、国际博协中国国家委员会主席、北京市人民政府专家顾问团顾问吕济民,中华全国集邮联合会秘书长盛名环,收藏协会副会长杜耀西等出席了北京秀世传播机构承办的首发式,全国政协副主席张克辉为首发式撰写了贺信。 共找到985,015 2 | 个相关网页. -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000023/12.txt: -------------------------------------------------------------------------------- 1 |   杭州  时间:2005年10月9日-11日 9:00-18:00  地址:杭州华辰国际饭店 四层会议厅(杭州平海路27号)  南京  时间:2005年10月17日-19日 9:00-18:00  地址:南京希尔顿国际大酒店 二层A厅(南京中山东路319号)  上海  时间:2005年10月21日-23日 9:00-18:00  地址:上海图书馆 第一展厅(上海市淮海中路1555号)  济南  时间:2005年10月27日-29日 9:00-18:00  地址:山东大厦 一层多功能厅(济南市马鞍山路2-1号)  北京  时间:2005年11月1日-3日 9:00-18:00  地址:北京港澳中心 二层宴会大厅(北京朝阳门北大街2号)    拍 卖 预 展  时间:2005年11月23日-25日 9:00-20:00  地点:北京亚洲大酒店(北京工体北路新中西街8号)  拍 卖  时间:  2005年11月26 上午9:30 2005年11月26 下午13:00  中国书画(一) 中国书画(二)  2005年11月27 上午9:30  中国书画(三) --《当代中国画风貌》  2005年11月27 下午13:00  中国油画  地点:北京亚洲大酒店 三层多功能厅(北京工体北路新中西街8号)  搜狗(www.sogou.com)搜索:“书画”,共找到2,095,334 2 | 个相关网页. -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000023/13.txt: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 夜幕下的太和门广场 5 |   9月18日晚,时值中国传统佳节农历八月十五中秋节之际,由中国故宫博物院主办、山东潍柴动力股份有限公司冠名赞助的“太和邀月颂和平——潍柴动力之夜”中秋招待会在北京故宫太和门广场举行。来自国内政府、文化演艺界及企业界等各界精英汇聚古老神秘的宫内广场,抒发当代国人对历史的追思和对中华民族未来的憧憬,举杯邀月共度中秋,把纪念故宫博物院建院80周年、中国人民抗日战争胜利60周年两个活动再次推向了高潮。本次招待会由著名学者田青和凤凰卫视当家花旦陈鲁豫、曹景行主持。 6 |   是日晚上,北京太和门广场灯光璀璨,高朋满座,文化氛围浓郁。来自戏曲界、演奏界、表演界的大师们给与会者奉献上了《思乡曲》《二泉映月》《八月十五月光明》等著名的传统曲目,著名表演家濮存昕、吴俊全等还朗诵了《水调歌头》《雪落在中国土地上》等著名古今诗歌,表达了对中华民族优秀传统文化的追思和对民族昌盛的期盼。此外,来自书画界的大师们还现场泼墨,鉴赏经典古画,并留下墨宝以作纪念。艺术表演家们在舞台上精彩的表现赢得了与会各界嘉宾的阵阵掌声,人们乘着朗朗月色,举杯邀月,畅谈古今,抒发着当代中国对历史的铭记和对未来民族复兴的祈盼。 7 | 独唱《今夜无人入睡》——著名男高音歌唱家莫华伦 8 | 小提琴演奏家陈曦与主持人陈鲁豫交流 9 |   今年是北京故宫博物院成立八十周年,八十年来,北京故宫为弘扬中华民族的传统文化,为保护我国珍贵的历史遗产作出了巨大的贡献;同时,今年也是中国人民抗日胜利六十周年,身处北京故宫的太和门广场正是当年日寇华北方面军向中国统辖华北地区的第十一战区投降的仪式举行的地方。可以说,身处紫禁城的太和殿见证了我国历史的兴衰荣辱,见证了中国人民抗日战争的伟大胜利;六十年后,在同一地点举行纪念活动,意义非同小可。它告诉我们要铭记历史,继往开来,要为中华民族的伟大复兴,为世界各族人民的和平而不懈奋斗! 10 | 濮存昕朗诵 11 |   据悉,来自潍柴动力股份有限公司的领导介绍,作为国内知名的内燃机研发、制造、销售骨干企业,潍柴动力一直关注首都文化产业的发展,希望凭借此次活动,给中国的精英人士提供一个更好的交流机会和场所,拓展企业发展平台,振奋民族精神,为繁荣国际文化交流,进一步开辟中国文化传承空间贡献更多的力量! 12 | 书法表演 13 |   晚会在著名男高音歌唱家莫华伦的一曲《今夜无人入眠》中结束,留给了节日的京城一个难忘的夜晚。 14 |   搜狗(www.sogou.com)搜索:“太和”,共找到322,079 15 | 个相关网页. -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000023/14.txt: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 5 | 《大长今》调查 6 | 7 | 1、你看《大长今》吗? 8 | 9 | 不看 10 | 11 | 赶上就看 12 | 13 | 正在追着看 14 | 15 | 看过n遍 16 | 17 | 2、《大长今》吸引你的是 18 | 19 | 情节曲折,悬念迭起 20 | 21 | 俊男靓女美食 22 | 23 | 爱情亲情友情感人,台词经典 24 | 25 | 励志向上,善和美打动人心 26 | 27 | 3、你认为日韩剧成功在哪里 28 | 29 | 细节取胜,平淡中见真情 30 | 31 | 情节设计合理,戏剧性强 32 | 33 | 人物立体丰满,贴近生活,比较真实 34 | 35 | 演员表演分寸适当,不夸张 36 | 37 | 包含很多时尚元素,画面唯美 38 | 39 | 40 | var NewWin = null; function WinOpen(url) {if(!NewWin || NewWin.closed) {NewWin=LoadWin(url,'win_poll',418,300);}else{NewWin.focus();}} function LoadWin(url, name, width, height) {var str='scrollbars,resizable,location,height='+height+',innerHeight='+height+',width='+width+',innerWidth='+width; if(window.screen) {var ah=screen.availHeight-30; var aw=screen.availWidth-10; var xc=(aw-width)/2; var yc=(ah-height)/2; str +=',left='+xc+',screenX='+xc; str +=',top='+yc+',screenY='+yc;} return window.open(url,name,str); }搜狗(www.sogou.com)搜索:“人物”,共找到28,456,427 41 | 个相关网页. -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000023/15.txt: -------------------------------------------------------------------------------- 1 | 2 | 【哀乐中年】 1949年文华影业公司出品 3 | 哀乐中年 4 |     原著:张爱玲编剧:桑弧导演:桑弧片长:100分钟色彩:黑白主演:石  挥  饰  陈绍常      韩  非  饰  陈建中      李浣青  饰  经理女儿      朱嘉琛  饰  敏华 5 | 【剧情简介】 6 |     陈绍常创办小学多年,自任校长。其妻英年早逝,留下三个孩子赖他照料。别人每每劝他续弦,但他目睹挚友刘之权的女儿敏华备受后母虐待之苦,便打消了续娶之念。后来,刘之权全家迁居外地,多年音讯杳然。某日,敏华突然前来叩见,谋求职业。绍常同情她的遭遇,便留她在校任教。此时,绍常的孩子也都成人。长子建中在一家银行供职,与银行经理的女儿结婚,社会地位也日益提高。他力劝绍常退休,在家颐养晚年。绍常被勉强说服而向学校提出辞呈,并推荐敏华继任校长。建中为了表示支持,恳请岳父捐款给学校并担任学校的董事长。绍常赋闲在家,孩子们成家后,与他往来日疏。只有敏华,为了工作常来和他谈心,她深知他的事业心很强,生命力也还旺盛,应该工作。经敏华热情、诚挚的邀请,绍常又回到学校。不久,学校里一个同事托他向敏华求婚,他忽然感到一种异样的心情,开始觉察到自己已爱上敏华。同时,他发现敏华也一直爱着他。于是,他告诉建中,自己准备结婚,却遭到建中与家里所有人的坚决反对。建中并宣称,他代表岳父以学校董事长的名义,将敏华撤职。绍常为维护他和敏华的感情,也毅然离开学校。他俩结婚后,共同创办另一所小学。在新学校开学之日,也正是敏华的婴儿呱呱坠地之时,他们都感到“生命无处不在”的喜悦。上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] 下一页  -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000023/16.txt: -------------------------------------------------------------------------------- 1 | 2 | 【倾城之恋】     1984年香港邵氏公司出品 3 | 倾城之恋 4 |       到处都是传奇,可不见得有这么圆满的收场。胡琴咿咿呀呀拉着,在万盏灯火的夜晚,拉过来又拉过去,说不尽的苍凉的故事——不问也罢!---【倾城之恋】 5 | 出品:邵逸夫原著:张爱玲改编:蓬草美术:区丁平摄影:何东尼作曲:林敏怡作词:林敏聪演唱:汪明荃片长:95min语言:粤语/普通话外文别名:Love in a FallenCity(1984)副导演:关锦鹏、曹建南导演:许鞍华主演:周润发  饰  范柳原      缪骞人  饰  白流苏获奖:第25届金马奖最佳服装设计       第4届香港电影金像奖最佳音乐 6 | 【剧情简介】       本片改编自张爱玲的同名原著小说,是一部具有相当怀旧色彩的爱情故事,讲述一个城市(香港)的陷落,是为了成全范柳原(周润发)和白流苏(缪骞人)的爱情。导演许鞍华捕捉到了男女之间那种似假还真的微妙感情,但对白有所拘紧,局限在原著小说中,有欠挥洒自如。本片的情节发展为前后二部分,前半部描写离婚多年的白流苏在上海的娘家饱爱兄嫂的讽刺欺凌,后半部白流苏到了香港,跟风流浪子周润发展开了拉锯式的爱情。缪演得相当敏感而细腻,把一个不错的上海女子塑造得相当有味道,而周也卖弄了他的俊雅潇洒。幸而导演掌握了对白独有的尖刻嘲讽,重现了香港四十年代的风情。上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] 下一页  -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000023/17.txt: -------------------------------------------------------------------------------- 1 | 2 | 【红玫瑰与白玫瑰】 1994年第一机构有限公司出品 3 | 红玫瑰白玫瑰 4 |       也许每一个男子全都有过这样的两个女人,至少两个.娶了红玫瑰,久而久之,红的变了墙上的一抹蚊子血,白的还是“床前明月光”;娶了白玫瑰,白的便是衣服上的一粒饭粘子,红的却是心口上的一颗朱砂痣。                                    --【红玫瑰与白玫瑰】 5 | 原著:    张爱玲编剧:    刘恒林 亦华导演:    关锦鹏摄影:    杜可风美术指导:朴若木色彩:    彩色片长:    110min分级:    芬兰/K-16语言:    粤语外文别名:Red Rose White Rose(1994)主演:    赵文宣  饰  佟振保          陈  冲  饰  王娇蕊          叶玉卿  饰  孟烟郦获奖:   台湾电影金马奖最佳女主角、最佳剧本、最佳美术设计、最佳造型设计、最佳电影音乐 6 | 【剧情简介】      振保的生命里就有两个女人,他说一个是他的白玫瑰,一个是他的红玫瑰。一个是圣洁的妻,一个是热烈的情妇……留洋回来的振保(赵文瑄饰)在一家外商公司谋了个高职。为了交通方便,他租了老同学王士洪的屋子。振保留学期间,有一个叫玫瑰的初恋情人。他曾因拒绝过玫瑰的求欢而获取了“柳下惠”的好名声。王士洪有一位风情万种的太太,她总令振保想入非非。有一次,士洪去新加坡做生意了,经过几番灵与肉的斗争,在一个乍暖还寒的雨日,振保被这位叫娇蕊(陈冲饰)的太太“囚住”了。令振保所料不及的是娇蕊这次是付出了真爱的。当她提出把真相告诉了王士洪时,振保病倒了。在病房,振保把真实的一面告诉了娇蕊——他不想为此情而承受太多责难。娇蕊收拾她纷乱的泪珠,出奇的冷静起来,从此走出了他的生命。  在母亲撮合下,振保带着点悲凉的牺牲感,娶了身材单薄、静如止水的孟烟鹂(叶玉卿饰)。新娘给人的感觉只是笼统的白净,她无法唤起振保的性欲。振保开始在外边嫖妓。可是有一天,他竟发现了他的阴影里没有任何光泽的白玫瑰烟鹂,居然和一个形象猬狎的裁缝关系暧昧。从此,振保在外边公开玩女人,一味地放浪形骸起来。有一天,他在公共汽车上巧遇了他生命中的“红玫瑰”娇蕊,她已是一种中年人的俗艳了。岁月无情,花开花落,在泪光中,振保的红玫瑰与白玫瑰已是一种现实中的幻影。旧日的善良一点一点地逼近振保。回到家,在一番歇斯底里的发作后,振保又重新变成了一个好人。 上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] 下一页  -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000023/18.txt: -------------------------------------------------------------------------------- 1 | 2 | 【半生缘】 1997年香港东方影业公司出品 3 | 半生缘 4 |     他一旦想起曼桢,就觉得他从来也没有停止想念她过。就是自己以为已经忘记她的时候,她也还是在那里的,在他一切思想的背后。                                                5 | 原著:张爱玲编剧:陈健忠色彩:彩色片长:125min语言:普通话外文别名:Eighteen Springs(1997)    Half Life Fate(1997)导演:许鞍华主演:吴倩莲  饰  顾曼桢      黎  明  饰  沈世均      黄  磊  饰  许叔惠      吴辰君  饰  石翠芝      梅艳芳  饰  顾曼璐      葛  优  饰   祝鸿才      王志文  饰   张豫槿获奖:1998年香港电影协会最佳女主角奖      1998年香港电影金像最佳女配角奖 6 | 【剧情简介】    30年代的上海。世钧和曼桢是同一工厂做工的恋人。曼桢早年丧父,家庭生活靠姐姐曼璐当舞女维持,后来曼璐又当了妓女,最终嫁给了有妇之夫祝鸿才。为了保全自已的地位,不能生育的曼璐以一种怨毒的心态与其夫合谋,令祝强奸了曼桢。曼桢为姐姐、姐夫生下一子,葬送了自已的恋情。姐姐死后,她也嫁给了祝鸿才。多年后,曼桢与世钧重逢,两人发现,前情虽在,后缘难续。 上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] 下一页  -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000023/19.txt: -------------------------------------------------------------------------------- 1 | 2 | 《金锁记》 3 | 金锁记 4 |    根据张爱玲同名小说改编,“张爱玲名著中的名著”,继《大宅门》《橘子红了》之后又一部唯美、豪华的家族大戏。清末民初,小镇上天真烂漫的少女曹七巧(刘欣饰)和京城大户姜家的三少爷季泽(邵峰饰)一见钟情,可七巧的哥哥曹大年(刘永生饰)贪图钱财要把妹妹嫁给患有软骨病的老二钟泽(气壳饰),七巧为了接近季泽,答应这门婚事。失望至极的季泽在仲泽的婚宴上喝得酩酊大醉,令七巧心痛欲裂。此后,季泽越来越沉沦,常常夜宿妓院,七巧冒险到妓院劝阻,与酒醉的季泽同居了一晚,并因此怀孕,生下一子,由此招致众人的诸多非议。仲泽为保护妻子,临终时,坚定地声称自己是这孩子的亲生父亲,姜老太太(奚美娟饰)亦为维护自家的名声,痛斥众人对七巧的攻击。老大伯泽(程前饰)夫妇为了倾吞家产,利用七巧对季泽的感情,设下一个个圈套,造成七巧和季泽误会重重,使得她们本来纯洁的情感在金钱和岁月的摧残下渐渐消逝。于是七巧的人格开始扭曲,性情变得冷酷,她甚至亲手毁掉了儿女的婚姻和幸福,变成一个刻薄自私、终日靠鸦片麻痹灵魂的女人。 上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] 下一页  -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000024/10.txt: -------------------------------------------------------------------------------- 1 | 2 |   本报北京5月9日电 3 | 董宾、高立英报道:北空某导弹团今天传出喜讯,营参谋长谭正提出的兵器改进方案,使困扰该团和兵器设计厂家三载的兵器重大隐患迎刃而解,赢得了官兵和有关专家的赞扬。 4 |   几年前,该团列装新型防空导弹,在检验性实弹打靶中,几次出现故障,影响了该新型武器系统战斗力的发挥。为彻底查找兵器问题隐患,有关兵器研发厂家多次派专家组进行伴随保障和跟踪观察。然而,由于故障症结难被察觉,问题始终久拖未决。 5 |   在该团前不久的实弹演练时,营参谋长谭正在调试兵器参数过程中,敏锐地察觉到这一问题再次出现。经过分析论证,他果断推定:战车某项计算机程序编排不当,是造成系统作战程序相互冲突和影响的主要原因。为此,他大胆提出了改进方案。有关专家对近百样程序进行抽样检测后,肯定了他的看法。针对他的建议,该团随后采取了应急措施,清除了故障隐患,打出了全面列装后的“满堂红”,长期困扰兵器故障终于得以解决。 6 |   看似偶然却艰辛。据了解,为彻底查找出武器系统隐患,谭正经过大量实践,对兵器性能了然于心,记下了几大本操作心得,先后对几十种可能的原因逐一进行推测、判断和排除,对上万组计算机数据进行统计、采样、筛选和分析,最终使问题顺利得以解决。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000024/11.txt: -------------------------------------------------------------------------------- 1 | 2 |   张连军 熊言春 本报特约通讯员 韩光 张旭航 3 |   【主人公小传】耿大勇,沈阳军区某装甲团四连连长。任连长以来,他带领连队多次完成新装备试训任务,先后荣立一等功一次,二等功一次,三等功两次。去年,他被沈阳军区树为“优秀指挥员”。 4 |   精通我国某新型坦克三大专业;对百余项常用技术性能参数和百余个常用部件“一口清”;百余种常见故障都能手到病除;创造了该型坦克实装操作的多项第一……沈阳军区某装甲团四连连长耿大勇,以顽强的拼搏精神,创造了一个又一个佳绩。这位貌不惊人的中尉军官,身上究竟蕴藏着怎样的能量?“千方百计地让新装备尽早发挥出最大效能,这是我责无旁贷的使命,也是我战胜一切困难的力量源泉。”耿大勇自豪地说。 5 |   勇担重任——不负众望练精兵 6 |   深夜,某陌生地域,“红”、“蓝”两军狭路相逢,展开殊死搏杀。战斗陷入胶着状态时,一路奇兵从“天”而降,以雷霆万钧之势直插“蓝军”腹地,一举端掉了“蓝军”指挥所。 7 |   “陆战之王”果然厉害!演练结束后,导演部的指挥和参谋人员对连长耿大勇倍加赞赏。 8 |   2004年7月,时任某装甲团八连连长的耿大勇蜜月仅仅过了7天就离开新婚的妻子,心急火燎地赶回部队。因为他听说部队刚刚列装了某新型坦克,新装备训练即将拉开帷幕。 9 |   该型坦克是全军首次列装,谁来当新型坦克连连长?师团党委研究决定:谁有本事谁登台,连长人选由比武打擂产生。 10 |   理论考核、实装操作。在一双双眼睛的注视下,功底扎实的耿大勇一路过关斩将,在20多名候选人中脱颖而出,被任命为新坦克连的第一任连长。 11 |   没有教材,他带领官兵从最基本的知识学起,先从长达2600多页的说明书开始研究。仅一个月时间,他就掌握了新坦克的部件构造、工作原理、操作规程等基础知识,并向团领导建言,请设计监造该型坦克的专家来连队现场教学。 12 |   27位专家住进了团队,耿大勇白天请专家授课,晚上带着全连官兵挑灯夜战消化吸收。他们谦虚好学的作风深深感染了专家,原计划只有半个月的专家指导活动,一直持续了二十几天。期间,耿大勇将专家讲课的录像资料、文字资料整理后刻入26张光盘,做成了新型坦克训练的辅导教材。 13 |   3个月后,他通过专家授课、对照说明书与实车摸索,在没有训练教材的情况下,达到对新装备构造、原理、性能的“一口清”,成为全连问不倒、专家考不住的“多面手”。师团两级常委学习新装备,耿大勇首当其冲成为教练员;坦克出了故障,他又成了维修员。 14 |   勇于探路——敢为人先铸辉煌 15 |   2004年10月,师受领了参加军区组织的实兵演习任务。耿大勇主动请缨:“新型坦克是我军陆地作战的主战装备,如不能尽早通过实兵演习将其练实练精,怎能在未来战场上克敌制胜?” 16 |   铁路输送、千里机动、百公里奔袭,列装仅3个月的新装备全程参加实兵演练,无一掉队,充分展示了优异性能。 17 |   “新型坦克不能跟在后面跑龙套,必须成为勇闯敌阵的尖刀利刃。”为了在恶劣自然条件下检验新型坦克的战斗性能,让新装备真正形成战斗力,耿大勇在实弹演习中再次请求当尖刀连。 18 |   炮弹运过来了,这是耿大勇第一次见到新型坦克的实弹。启封炮管、校正火炮,战斗发起前的两个小时转瞬即逝,而按操作规程,实弹射击前还应进行实弹校炮。然而此时,出发命令已经下达。 19 |   耿大勇拉开坚持要求实弹校炮的专家,坚定地钻入铁甲战车,承担起打第一炮的重任。 20 |   “轰!”高速前进的坦克怒吼着打出了第一炮。这是该型坦克列装后打出的第一炮,高速出膛的穿甲弹准确击中了远距离靶标。 21 |   首发命中!演习场沸腾了,到场观摩的坦克设计专家啧啧称奇,现场指挥的军区首长交口称赞。 22 |   军区导演部经评定后得出结论,该型坦克列装3个月已初步形成战斗力。耿大勇用他敢为天下先的果敢精神、时不我待的危机意识,在我军某新型坦克的发展史上写下了浓重的一笔。 23 |   在平时训练中,耿大勇严格要求,大胆尝试。压制观瞄系统仪器昂贵,一块小小的热成像仪接收玻璃就4万多元。有的同志提出,有关训练课目风险太大,还是不要训为好。耿大勇却认为,决不能用消极保安全来降低训练标准。在制定出详实训练和警戒预案后,他第一个上车进行训练。结果全连无一漏训,全部达到优秀标准。 24 |   勇于创新——实现装备新跨越 25 |   初冬的科尔沁草原,滴水成冰。耿大勇率新型坦克连在营编成内千里奔袭,直插敌阵。突然,“蓝军”对我实施大功率电子干扰,友邻连队与指挥所失去联系,若失去友邻支援孤军奋战,战斗很可能会以失败告终。 26 |   危急关头,耿大勇急中生智,他利用简易记号通知友邻:“收缩队形,向我靠拢!”而后,他引导全营继续发起冲击。 27 |   “战斗”胜利后,导演部对耿大勇灵活处置“敌”情赢得战斗胜利的举措大为赞赏。但耿大勇深知,某新型坦克毕竟只是少量列装,实现新老装备的完美结合,才能真正推动战斗力跨越式发展。 28 |   从此,耿大勇开始了新一轮的刻苦攻关。整整两个月,他把自己“泡”在各种资料里,啃下了《装甲战》、《坦克作战理论》等许多大部头的著作,并对两代主战坦克的战技术性能进行定量分析,总结出“新装备靠前观察定位、射击诸元传老装备”等10余种战法,有效地提升了部队整体作战能力。 29 |   高素质催生战斗力。在耿大勇的建议下,前年10月份连队建成全师规模最大的连队网络学习室,每周拿出两个晚上组织官兵学习培训,每月组织一次考核比武,现在连队干部全部通过国家计算机二级考试,战士人人都能独立制作多媒体课件。连队还开展了“一专多能”训练,连队整体作战能力显著提升,全连行进间对固定目标射击,取得114发炮弹命中107发的好成绩。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000024/12.txt: -------------------------------------------------------------------------------- 1 | 2 |   周维华 田宁 本报特约通讯员 侯国荣 3 |   4月16日凌晨,一阵急促的报警铃声骤然响起。刚刚在上级组织的军事训练考核中夺得桂冠、被誉为“陆地铁拳”的兰州军区某装甲团,组织千人百车挺进腾格里沙漠腹地,拉开了综合演练的帷幕。 4 |   紧急出动风驰电掣 5 |   [演练实录]作战时间4月16日凌晨4时50分。上级命令装甲团务必于当日13时前到达预定作战地域。 6 |   5时13分。团长张永明通过无线电台下达命令:“迅速进入一级战备!”顷刻之间,寂静的营区就像开足马达的机器高速运转起来,各种车辆在短短几分钟内开到了指定位置。“前沿攻击群准备完毕!”、“纵深攻击群准备完毕!”通信、工兵、防化、侦察等分队打破建制,按战斗要素迅速补充到各攻击群(队),后装保障群正在紧张地为各作战群(队)补充弹药、油料、器材等。 7 |   “向作战地域开进!”5时18分,团长一声令下,上百辆坦克、步兵战车排成三条长龙飞奔作战地域。 8 |   [相关链接]几年前,装甲团进行紧急拉动演练,全团集合就用了50多分钟。今年,该团从首长、机关到营连分队,都制定了一整套紧急出动、战备等级转换、抢险救灾等战备行动预案,并坚持不定期组织实兵、实装拉动演练。在此基础上,团里研制了一批便携式野战箱、柜,实现了战备器材装箱化、弹药补给精确化、紧急出动程序化,使部队远程机动能力明显提高。 9 |   网上鏖战虚拟对抗 10 |   [演练实录]作战时间4月16日6时许。突然,信息传输员报告:“团指挥系统受到‘敌方’破坏干扰,通信指挥中断。” 11 |   “立即启动信息化作战单元指挥平台,对‘敌’干扰雷达、破袭分队进行搜索,实施电磁压制和火力打击。”无线电台传来“红军”指挥员沉着冷静的命令。很快,“红军”就将“蓝军”目标逐一锁定。“红军”信息化作战单元指挥屏幕上显示:“敌”一个加强坦克连正借助强电子干扰和烟雾遮障快速穿插,企图利用正面火力突袭的间隙,对“红军”指挥所实施偷袭。 12 |   面对“蓝军”的电磁干扰和突然袭击,“红军”沉着应战,利用“蓝军”电磁压制的间隙,巧妙地通过自动化作战指挥局域网源源不断地将敌情通报、作战命令传输到演练一线。 13 |   [相关链接]面对新军事变革的挑战,装甲团确立了“以现有装备为平台,以无线数据网为载体,以作战指挥流程为主线,以指挥控制为重点”的信息化建设总体规划,构建起团、营、连、排、班(车)五位一体的信息化作战模块,实现了团指挥网络一体化。 14 |   铁拳突击攻如猛虎 15 |   [演练实录]作战时间4月17日凌晨3时许,牛首山某山谷。“嗖,嗖,嗖!”“红军”数枚车载导弹喷射出橘黄色的火舌,呼啸着扑向“蓝军”阵地,对进攻之“敌”进行了猛烈打击。 16 |   随着战场态势的变化。各作战群(队)长下达了火力打击的命令。“轰!轰!轰!”榴弹炮、坦克炮、车载导弹大显神威,各种火力呼啸着向“敌”目标飞去…… 17 |   铁拳突击,攻如猛虎。一时间,一发发愤怒的炮弹砸在“蓝军”阵地上,“蓝军”的防线开始土崩瓦解。“红军”一举攻克“蓝军”阵地。 18 |   随着3发绿色信号弹升空,演练落下帷幕。此刻,“陆地铁拳”的旗帜高高飘扬在“蓝军”6号高地上。 19 |   [相关链接]这次综合演练,装甲团整建制挺进腾格里沙漠和高山峡谷等复杂地域,进行了实兵实装对抗演练。他们采取全要素之间练协同、模块之间练集成的方法,探索模块整合训练的具体内容、方法手段,探索实战背景下的作战编组、指挥模式、基本战法等,实现了单一作战模块内各个作战要素的有机整合。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000024/13.txt: -------------------------------------------------------------------------------- 1 | 2 |   本报特约通讯员 刘一代 本报特约记者 王永孝 3 |   阳春时节,记者来到第二炮兵指挥学院作战实验室,浓浓的信息化气息扑面而来。作战实验室主任甄明安告诉记者:“我们的目标是‘出了实验室,就能上战场’,如今已有近2000名学员在这里接受过对抗模拟演练。” 4 |   “模拟战争”学打仗 5 |   未来战场是什么样子?这是军事专家和各级指挥员共同关注和深入研究的一个重要问题。 6 |   战争年代,可以在战争中学会打仗,而和平时期,可以通过“模拟战争”学打仗。那么,“模拟战争”如何实现呢? 7 |   战斗精神和技能的培育,离不开战场环境的熏陶。只有把官兵投入到逼真的“战场”环境当中,才能在“实战”中锤炼出过硬的战斗胆识和技能。 8 |   解决这些严峻的现实问题,都离不开一个逼真的“战场”!然而,要建设一个这样的平台又谈何容易!对于素有“百人一杆枪”之称的战略导弹部队来说,开展实战背景下的导弹发射训练,所需的导弹武器装备、协同要素、操作号手相对较多,设置战场环境,简直困难重重。 9 |   打造适应未来战争需要高素质人才的紧迫感牵动着学院的上上下下。院长李体林亲自挂帅,跑机关、下部队,协调有关业务部门充分调研论证。他们以自身的科技力量为依托,经过多年努力,终于建成了集“导调指挥、战场仿真、监测评估、训练管理、综合保障”等多功能为一体的作战实验室。. 10 |   激烈对抗练真功 11 |   作战实验室的功能到底有多大?4月上旬,记者在这个实验室目睹了一场“某型导弹部队作战演习”。只见“红”、“蓝”指挥所双方指挥员根据战场发展的态势,正在果断地下达各种作战命令。电子显示屏上,战场态势瞬息万变。“蓝军”第一波次导弹猛烈地突击后,“红军”阵地硝烟弥漫。“红”“蓝”两军在虚拟战场上斗智斗勇,时而“红军”阵地被袭,时而“蓝军”战场网络陷入瘫痪。担任各种角色的学员完全将自己置身到战斗之中,在面临强敌进攻时,有的运筹帷幄,有的手忙脚乱。 12 |   好一个真实的战斗场面!据介绍,这是作战实验室的三维视景仿真系统,它由战场观察模块、视景仿真实体、视景数据库等组成,用于三维战场场景的生成。有了它,人员、装备的真实性和地形的立体感大大增强,学员在这里学习训练,如同身临其境。 13 |   “实验室就是战场。”这是深深根植于该院师生心中的一个观念。利用实验室对抗演练,该院要求每一名参演学员一进入“战场”,必须进入“战斗”状态,每一批学员都要结合新装备使用、新战法攻关和新课目试训,将理论和实践、技术和战术、战法和训法有机地结合起来,拿出自己的对策,在“炮火硝烟”中砥砺打赢本领。 14 |   七个学科撑起一个“平台” 15 |   更让人惊喜的是,作战实验室的建成,把军种战役学、作战指挥学等7个学科群有机地融合在一起。7个学科群专业有别,又互有联系,一体化的教学功能大大增强。 16 |   加强软件开发,拓展作战实验室功能。该院集中力量研制并开发出用于作战指挥、战法训练和作战实验研究的各型导弹训练模拟系统,以及一体化联合作战指挥训练系统等10多套软件系统,这些系统基本满足了第二炮兵部队各级指挥员提高作战指挥能力的培训和信息化作战功能、作战指挥效能的实验研究需要,从而使作战实验室成为多学科知识的交会点。 17 |   突出集团意识,建设作战实验室群。该院以作战实验室为核心,将作战指挥学、军种战役学、合同战术学等学科的专业实验室,第二炮兵作战模拟实验中心,装备指挥自动化实验室等重点教学场所与作战实验室联为一体,通过网上互通,构建起了一个庞大的作战实验室群,实现了跨学科建设资源的综合利用。 18 |   注重课题牵引,培养学科学术带头人。围绕作战实验室的建设,学院先后投资700多万元,遴选60多个课题,吸纳10多个教研室的教员参与课题研究,培养出一大批在全军有影响的中青年导弹专家。 19 |   作战实验室的功能不断拓展,并发展成为全军重点建设项目。如今,作战实验室已成为学院信息技术的聚焦地和信息交流中心,多学科专业知识在这里交会融合,促进了学科建设整体水平的提高。在实验室建设的推动下,该学院第二炮兵战役学科被评为全军重点学科,战役学博士后科研流动站在该院正式挂牌。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000024/15.txt: -------------------------------------------------------------------------------- 1 | 2 |   中新网5月9日电 3 | 据共同社报道,围绕导弹防御系统(MD)问题,日本海上自卫队9日宣布,将派海上自卫队“宙斯盾”舰参加美国即将于6月在夏威夷近海实施的海基型拦截导弹(SM3)的拦截试验,对目标进行雷达跟踪。 4 |   “宙斯盾”护卫舰是首次参加此类拦截演习。海上自卫队幕僚长(相当于参谋长)斋藤隆表示,“将力争提高双方在海上的相互协调性”,由此可见,日美在MD方面共享信息等合作体制将进一步得到确立。 5 |   据海上自卫队透露,预定参加此次演习的是曾经根据《反恐特别措施法》在阿拉伯海上进行过海上燃油补给活动的“雾岛(KIRISHIMA)”号(7250吨)。美国海军的“宙斯盾”舰计划用SM3对模拟弹道导弹进行拦截,而“雾岛”号将跟踪模拟弹道导弹的轨迹。 6 |   “雾岛”号计划于本月从位于神奈川县的横须贺基地出发,在参加拦截试验结束后还将参加环太平洋联合演习。 7 |   美国迄今为止曾6次成功地进行了SM3拦截试验。日本政府将于2007年度年底开始为海上自卫队的”宙斯盾”护卫舰装备SM3。 -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000024/16.txt: -------------------------------------------------------------------------------- 1 |   “猎鹰”展翅——中国L15新型高级教练机研制成功 2 |   "猎鹰"的首飞成功,对于完善中国初、中、高级教练机的研制生产体系,满足第三代和新型飞机飞行员的训练需要,竞争国际教练机市场都具有重要的意义。 3 |   伊朗全面备战防突袭 4 |   伊朗加紧更新武器装备、扩大弹道导弹生产与储存,本着“放进来打”的原则,发挥自身本土作战的优势,使侵略者意识到,与伊朗的战争将是一场得不偿失之仗。 5 |   台军重视烟幕装备 6 |   美国新驻华武官打过仗 7 |   英国海军的希望——45型导弹驱逐舰 8 |   目标:伊朗核设施——以色列F-16I战斗机 9 |   二战中的德国直升机 10 |   坦克与直升机之争 11 |   PzH2000自行榴弹炮行销欧洲 12 |   美国的反恐适应性训练基地 13 |   美军士兵在基地几可乱真的模拟环境中练战术、练协同,也练习如何与占领区居民打交道。为期两周左右的高强度培训,让士兵更从容地开赴反恐前线。 14 |   铁甲的圣地——中国坦克博物馆行记 15 |   中国唯一一座以坦克装甲兵为主题的专题博物馆,其中不乏珍贵的馆藏文物,作为军事爱好者,这是不容错过的好去处。 16 |   可预知的屠戮——老虎峰血战沉思 17 |   老虎峰是印巴军事对峙的锡亚琴冰川地区的重要咽喉要地。1999年的卡吉尔之战中,印巴双方曾在这里展开了一场殊死的厮杀。 18 |   X-23突击步枪 19 |   X-23是读者设计的一款突击步枪,集成了G36和SCAR的部分优点,用3DMax软件制作完成。   -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000024/17.txt: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 5 |   “猎鹰”试翼——我国第三代高级教练机开始试飞 6 |   Chinese Third Generation Training Plane 7 | Begins Flight Test 8 |   L-15总设计师对若干问题的解答 9 |   An Interview with the Chief-Designer of L-15 10 |   崎岖的“太行”之路——我国新型大推力涡扇发动机的研制历程 11 |   Chinese Home Made New High Thrust Turbofan Engine Fielded 12 |   伊朗:孤独的圣战 13 |   Iran Focus: Will Iran Be the Next Iraq 14 |   核萌芽的保护伞——伊朗常规武装力量评介 15 |   An Assessment: The Conventional Armed Forces of Iran 16 |   专题:军用机器人技术 17 |   Military Robots Technology 18 |   科学而非幻想——美国军用机器人走向战场 19 |   It's Not Fiction: U.S Military Robots Go To War 20 |   机器人技术及其军事应用——访北京航空航天大学ITM实验室 21 |   Robotics Technology and Its Military Applications 22 |   维护公众安全的机器人卫士——武警装备专家谈反恐机器人 23 |   On the Anti-Terror Robots: An Interview with the Researcher from Chinese 24 | People's Armed Police Force 25 |   以创新性思维发展中国的拐弯枪 26 |   An Innovation: Chinese-Made Corner Shot Weapon System 27 |   “探戈杀手”演绎美国未来潜艇技术 28 |   Tango Bravo Brings Fundamental Changes to U.S Next Generation Submarine 29 |   展望未来的军用无线局域网 30 |   Future Military Wireless LAN: Wi-Fi or WAPI, WiMAX or McWILL? 31 |   突破生理耐受极限——欧美飞行员生命保障系统评介 32 |   The Development of Pilots Life Support System in the U.S and Europe 33 |   不走别人走过的弯路——外军信息化建设中的几点教训 34 |   Some Lessons Taken from Informationization Construction of Foreign Armed 35 | Forces 36 |   飞速扩展的美国陆军无人机训练 37 |   The Training for U.S Army UAV Rapidly Expanded 38 |   美空军培养专职无人机飞行员 39 |   A Career Flying UAVs 40 |   评析美国两份防务评审报告 41 |   An Contrast: U.S Government 06'QDR Report and A Non-Government One 42 |   美国人看日本国防工业发展 43 |   An U.S Point of View: The Development of Japanese Defense Industry 44 |   台湾岛及周边海区的地理与气候 45 |   Geographical and Climatic Survey of Taiwan Island and Its Circumjacent Sea 46 | Area   -------------------------------------------------------------------------------- /Bayes_Project3/SogouC/Sample/C000024/19.txt: -------------------------------------------------------------------------------- 1 | 2 |   以禁止女兵穿低腰裤 3 |   已有120名女兵因违规被关禁闭 4 |   据新华社电 以军日前正在开展一场“全方位作战行动”。这次作战的目标可不是巴勒斯坦,而是女兵的低腰裤。 5 |   以军一位发言人7日说:“根据以色列国防军军纪,北方司令部决定实施更加严格的政策,使士兵的穿着符合纪律规定。”以色列女兵纷纷抱怨说,军装不能很好地展示她们的身材。为了追赶时尚潮流,这些女兵们经常重新设计自己的军装,有些人甚至把它们改成了低腰裤。然而,女兵们爱美的天性并没有获得军队指挥官的同情,他们认为,低腰裤严重威胁着以军的纪律基础。 6 |   以军要求女兵们把那些改过的低腰裤交到军需商店,以换回符合规定的军裤。此外,目前已经约有120名女兵因穿着违规低腰裤而被关禁闭。  -------------------------------------------------------------------------------- /Bayes_Project3/stopwords_cn.txt: -------------------------------------------------------------------------------- 1 | 的 2 | 一 3 | 不 4 | 在 5 | 人 6 | 有 7 | 是 8 | 为 9 | 以 10 | 于 11 | 上 12 | 他 13 | 而 14 | 后 15 | 之 16 | 来 17 | 及 18 | 了 19 | 因 20 | 下 21 | 可 22 | 到 23 | 由 24 | 这 25 | 与 26 | 也 27 | 此 28 | 但 29 | 并 30 | 个 31 | 其 32 | 已 33 | 无 34 | 小 35 | 我 36 | 们 37 | 起 38 | 最 39 | 再 40 | 今 41 | 去 42 | 好 43 | 只 44 | 又 45 | 或 46 | 很 47 | 亦 48 | 某 49 | 把 50 | 那 51 | 你 52 | 乃 53 | 它 54 | 怎么 55 | 任何 56 | 连同 57 | 开外 58 | 再有 59 | 哪些 60 | 甚至于 61 | 又及 62 | 当然 63 | 就是 64 | 遵照 65 | 以来 66 | 赖以 67 | 否则 68 | 此间 69 | 后者 70 | 按照 71 | 才是 72 | 自身 73 | 再则 74 | 就算 75 | 即便 76 | 有些 77 | 例如 78 | 它们 79 | 虽然 80 | 为此 81 | 以免 82 | 别处 83 | 我们 84 | 依据 85 | 趁着 86 | 就要 87 | 各位 88 | 别的 89 | 前者 90 | 不外乎 91 | 虽说 92 | 除此 93 | 个别 94 | 的话 95 | 甚而 96 | 那般 97 | 譬如 98 | 作为 99 | 谁人 100 | 进而 101 | 那边 102 | 首先 103 | 因此 104 | 怎么样 105 | 果然 106 | 除非 107 | 以上 108 | 为何 109 | 要么 110 | 随时 111 | 如果说 112 | 诸如 113 | 还是 114 | 一旦 115 | 基于 116 | 本人 117 | 因而 118 | 继而 119 | 不单 120 | 此时 121 | 等等 122 | 截至 123 | 不但 124 | 故而 125 | 全体 126 | 从此 127 | 对于 128 | 朝着 129 | 怎样 130 | 以为 131 | 那儿 132 | 或是 133 | 本身 134 | 况且 135 | 处在 136 | 吧 137 | 不至于 138 | 那个 139 | 被 140 | 诸位 141 | 从而 142 | 比 143 | 各自 144 | 针对 145 | 此外 146 | 何处 147 | 为了 148 | 这般 149 | 别 150 | 仍旧 151 | 既然 152 | 反而 153 | 关于 154 | 较之 155 | 不管 156 | 趁 157 | 彼时 158 | 这边 159 | 不光 160 | 宁可 161 | 要是 162 | 其他 163 | 其它 164 | 由于 165 | 还要 166 | 经过 167 | 不过 168 | 来说 169 | 当 170 | 从 171 | 除了 172 | 到 173 | 既是 174 | 的确 175 | 得 176 | 说来 177 | 打 178 | 据此 179 | 只限于 180 | 什么的 181 | 还有 182 | 只怕 183 | 不尽 184 | 多会 185 | 正巧 186 | 凡 187 | 为什么 188 | 以至 189 | 以致 190 | 某个 191 | 与否 192 | 凭借 193 | 儿 194 | 不仅 195 | 尔 196 | 两者 197 | 该 198 | 另外 199 | 一来 200 | 正如 201 | 那里 202 | 不尽然 203 | 毋宁 204 | 这儿 205 | 嘿嘿 206 | 就是说 207 | 正是 208 | 既往 209 | 随着 210 | 于是 211 | 各 212 | 给 213 | 跟 214 | 那么 215 | 而后 216 | 和 217 | 何 218 | 似的 219 | 不料 220 | 其余 221 | 或者 222 | 介于 223 | 别人 224 | 还 225 | 这个 226 | 受到 227 | 只是 228 | 即使 229 | 即 230 | 几 231 | 不论 232 | 本着 233 | 既 234 | 及至 235 | 加以 236 | 多么 237 | 其中 238 | 别说 239 | 这会 240 | 依照 241 | 人们 242 | 如此 243 | 个人 244 | 出来 245 | 看 246 | 另一方面 247 | 唯有 248 | 据 249 | 距 250 | 靠 251 | 接着 252 | 何况 253 | 啦 254 | 加之 255 | 至今 256 | 凡是 257 | 他们 258 | 一切 259 | 那时 260 | 只限 261 | 不然 262 | 许多 263 | 在于 264 | 了 265 | 某某 266 | 除外 267 | 来自 268 | 便于 269 | 同时 270 | 只消 271 | 只需 272 | 不如 273 | 只要 274 | 另 275 | 并不 276 | 不仅仅 277 | 这里 278 | 么 279 | 总之 280 | 因为 281 | 每 282 | 固然 283 | 们 284 | 不是 285 | 嘛 286 | 或者说 287 | 然而 288 | 假如 289 | 如何 290 | 这么 291 | 可见 292 | 如果 293 | 拿 294 | 简言之 295 | 多少 296 | 哪 297 | 那 298 | 光是 299 | 非但 300 | 呵呵 301 | 只有 302 | 只因 303 | 连带 304 | 正值 305 | 沿着 306 | 哪儿 307 | 他人 308 | 若非 309 | 怎么办 310 | 她们 311 | 您 312 | 凭 313 | 而且 314 | 与其 315 | 如同下 316 | 有的 317 | 那些 318 | 甚至 319 | 为止 320 | 无论 321 | 鉴于 322 | 嘻嘻 323 | 哪个 324 | 然后 325 | 直到 326 | 且 327 | 却 328 | 并非 329 | 对比 330 | 为着 331 | 一些 332 | 让 333 | 何时 334 | 仍 335 | 啥 336 | 而是 337 | 自从 338 | 比如 339 | 之所以 340 | 如 341 | 你们 342 | 若 343 | 使 344 | 那样 345 | 所以 346 | 得了 347 | 谁 348 | 当地 349 | 有关 350 | 所有 351 | 因之 352 | 用来 353 | 虽 354 | 随 355 | 所在 356 | 同 357 | 对待 358 | 而外 359 | 分别 360 | 所 361 | 她 362 | 某些 363 | 对方 364 | 哇 365 | 嗡 366 | 往 367 | 哪 368 | 不只 369 | 但是 370 | 全部 371 | 尽管 372 | 些 373 | 大家 374 | 以便 375 | 自己 376 | 可是 377 | 反之 378 | 这些 379 | 向 380 | 什么 381 | 由此 382 | 万一 383 | 而已 384 | 何以 385 | 咱们 386 | 沿 387 | 值此 388 | 向着 389 | 哪怕 390 | 倘若 391 | 出于 392 | 哟 393 | 如上 394 | 如若 395 | 替代 396 | 用 397 | 什么样 398 | 如是 399 | 照着 400 | 此处 401 | 于 402 | 这样 403 | 每当 404 | 咱 405 | 此次 406 | 至于 407 | 则 408 | 怎 409 | 曾 410 | 至 411 | 致 412 | 此地 413 | 要不然 414 | 逐步 415 | 格里斯 416 | 本地 417 | 着 418 | 诸 419 | 要不 420 | 自 421 | 其次 422 | 尽管如此 423 | 遵循 424 | 乃至 425 | 若是 426 | 并且 427 | 如下 428 | 可以 429 | 才能 430 | 以及 431 | 彼此 432 | 根据 433 | 随后 434 | 有时 -------------------------------------------------------------------------------- /BayesianAnalysisWithPython/Gauss.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Sun Jul 29 16:34:33 2018 4 | python高斯分布概率密度函数 5 | 6 | @author: wzy 7 | """ 8 | 9 | import matplotlib.pyplot as plt 10 | import numpy as np 11 | from scipy import stats 12 | 13 | # Mu可以从-1、0、1三个值中取值 14 | mu_params = [-1, 0, 1] 15 | # delta可以从0.5、1、1.5三个值中取值 16 | sd_params = [0.5, 1, 1.5] 17 | # x为从-7到7等间隔取100个点 18 | x = np.linspace(-7, 7, 100) 19 | # 把画布分割为3行3列 20 | # x- or y-axis will be shared among all subplots 21 | # 返回figure对象、 Axes object or array of Axes objects. 22 | f, ax = plt.subplots(len(mu_params), len(sd_params), sharex=True, sharey=True) 23 | for i in range(len(mu_params)): 24 | for j in range(len(sd_params)): 25 | # 选定Mu值和delta值 26 | mu = mu_params[i] 27 | sd = sd_params[j] 28 | # 定义一个正态分布,期望是mu,标准差是sd 29 | # .pdf(x)标准正态分布曲线 30 | y = stats.norm(mu, sd).pdf(x) 31 | # 绘制图形 32 | ax[i, j].plot(x, y) 33 | # 绘制图例alpha=0 表示 100% 透明 34 | ax[i, j].plot(0, 0, label="$\\mu$ = {:3.2f}\n$\\sigma$ = {:3.2f}".format (mu, sd), alpha=0) 35 | # 设置图例大小 36 | ax[i, j].legend(fontsize=12) 37 | # 标注x轴 38 | ax[2, 1].set_xlabel('$x$', fontsize=16) 39 | # 标注y轴 40 | ax[1, 0].set_ylabel('$pdf(x)$', fontsize=16) 41 | # tight_layout automatically adjusts subplot params so that the subplot(s) fits in to the figure area. 42 | plt.tight_layout() 43 | # 显示 44 | plt.show() -------------------------------------------------------------------------------- /CART_Project2/CART.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Wed Aug 1 20:55:39 2018 4 | 5 | @author: wzy 6 | """ 7 | import matplotlib.pyplot as plt 8 | import numpy as np 9 | 10 | """ 11 | 函数说明:加载数据 12 | 13 | Parameters: 14 | fileName - 文件名 15 | 16 | Returns: 17 | dataMat - 数据矩阵 18 | 19 | Modify: 20 | 2018-08-01 21 | """ 22 | def loadDataSet(fileName): 23 | dataMat = [] 24 | fr = open(fileName) 25 | for line in fr.readlines(): 26 | curLine = line.strip().split('\t') 27 | # 转换为float类型 28 | # map()是 Python 内置的高阶函数,它接收一个函数 f 和一个 list,并通过把函数 f 依次作用在 list 的每个元素上,得到一个新的 list 并返回。 29 | fltLine = list(map(float, curLine)) 30 | dataMat.append(fltLine) 31 | return dataMat 32 | 33 | 34 | """ 35 | 函数说明:绘制数据集 36 | 37 | Parameters: 38 | fileName - 文件名 39 | 40 | Returns: 41 | None 42 | 43 | Modify: 44 | 2018-08-01 45 | """ 46 | def plotDataSet(filename): 47 | dataMat = loadDataSet(filename) 48 | n = len(dataMat) 49 | xcord = [] 50 | ycord = [] 51 | # 样本点 52 | for i in range(n): 53 | xcord.append(dataMat[i][1]) 54 | ycord.append(dataMat[i][2]) 55 | fig = plt.figure() 56 | ax = fig.add_subplot(111) 57 | # 绘制样本点 58 | ax.scatter(xcord, ycord, s=20, c='blue', alpha=.5) 59 | plt.title('DataSet') 60 | plt.xlabel('X') 61 | plt.show() 62 | 63 | 64 | if __name__ == '__main__': 65 | filename = 'ex0.txt' 66 | plotDataSet(filename) 67 | -------------------------------------------------------------------------------- /CART_Project4/Figure_1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/CART_Project4/Figure_1.png -------------------------------------------------------------------------------- /CART_Project6/GUI.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Thu Aug 2 13:57:55 2018 4 | 5 | @author: wzy 6 | """ 7 | import matplotlib 8 | # 设置后端TkAgg 9 | matplotlib.use('TkAgg') 10 | # 将TkAgg和matplotlib连接起来 11 | from matplotlib.backends.backend_tkagg import FigureCanvasTkAgg 12 | # 图框 13 | from matplotlib.figure import Figure 14 | import numpy as np 15 | # 绘图工具包 16 | import tkinter as tk 17 | # 调用CART回归树中的代码 18 | import CART 19 | 20 | """ 21 | 函数说明:绘制原始数据的散点图以及拟合数据的曲线图 22 | 23 | Parameters: 24 | tolS - 允许的误差下降值 25 | tolN - 切分的最小样本数 26 | 27 | Returns: 28 | None 29 | 30 | Modify: 31 | 2018-08-02 32 | """ 33 | def reDraw(tolS, tolN): 34 | # 清空画布 35 | reDraw.f.clf() 36 | # 只有一个格子用于填充图形 37 | reDraw.a = reDraw.f.add_subplot(111) 38 | # 检查复选框是否选中 39 | # 选中调用模型树进行回归 40 | if chkBtnVar.get(): 41 | if tolN < 2: 42 | tolN = 2 43 | myTree = CART.createTree(reDraw.rawDat, CART.modelLeaf, CART.modelErr, (tolS, tolN)) 44 | yHat = CART.createForeCast(myTree, reDraw.testDat, CART.modelTreeEval) 45 | # 没选中调用回归树 46 | else: 47 | myTree = CART.createTree(reDraw.rawDat, ops=(tolS, tolN)) 48 | yHat = CART.createForeCast(myTree, reDraw.testDat) 49 | # 绘制真实值的散点图 50 | reDraw.a.scatter(reDraw.rawDat[:, 0].tolist(), reDraw.rawDat[:, 1].tolist(), s=5) 51 | # 绘制预测值曲线 52 | reDraw.a.plot(reDraw.testDat, yHat, 'b', linewidth=2.0) 53 | # 画布显示 54 | reDraw.canvas.show() 55 | 56 | 57 | """ 58 | 函数说明:获取文本框输入值 59 | 60 | Parameters: 61 | None 62 | 63 | Returns: 64 | None 65 | 66 | Modify: 67 | 2018-08-02 68 | """ 69 | def getInputs(): 70 | # 期望输入为整数 71 | try: 72 | tolN = int(tolNentry.get()) 73 | # 清除错误用默认替换 74 | except: 75 | tolN = 10 76 | print("enter Integer for tolN") 77 | tolNentry.delete(0, END) 78 | tolNentry.insert(0, '10') 79 | # 期望输入为浮点数 80 | try: 81 | tolS = float(tolSentry.get()) 82 | except: 83 | tolS = 1.0 84 | print("enter Float for tolS") 85 | tolSentry.delete(0, END) 86 | tolSentry.insert(0, '1.0') 87 | return tolN, tolS 88 | 89 | 90 | """ 91 | 函数说明:根据文本框输入参数绘图 92 | 93 | Parameters: 94 | None 95 | 96 | Returns: 97 | None 98 | 99 | Modify: 100 | 2018-08-02 101 | """ 102 | def drawNewTree(): 103 | # 从文本框中获取参数 104 | tolN, tolS = getInputs() 105 | # 绘制图 106 | reDraw(tolS, tolN) 107 | 108 | 109 | # 创建窗口 110 | root = tk.Tk() 111 | reDraw.f = Figure(figsize=(5,4), dpi=100) 112 | # matplotlib的后端操作 113 | reDraw.canvas = FigureCanvasTkAgg(reDraw.f, master=root) 114 | reDraw.canvas.show() 115 | reDraw.canvas.get_tk_widget().grid(row=0, columnspan=3) 116 | # 添加文字标签 网格布局 columnspan和rowspan的值告诉布局是否允许跨列或跨行 117 | tk.Label(root, text="tolN").grid(row=1, column=0) 118 | # 添加文本输入框 119 | tolNentry = tk.Entry(root) 120 | tolNentry.grid(row=1, column=1) 121 | # 默认填入10 122 | tolNentry.insert(0, '10') 123 | tk.Label(root, text="tolS").grid(row=2, column=0) 124 | tolSentry = tk.Entry(root) 125 | tolSentry.grid(row=2, column=1) 126 | tolSentry.insert(0, '1.0') 127 | # 添加按键控件,按下连接到drawNewTree函数 128 | tk.Button(root, text="ReDraw", command=drawNewTree).grid(row=1, column=2, rowspan=3) 129 | # 按钮整数数值用来读取Checkbutton状态 130 | chkBtnVar = tk.IntVar() 131 | # 添加复选框 132 | chkBtn = tk.Checkbutton(root, text="Model Tree", variable=chkBtnVar) 133 | chkBtn.grid(row=3, column=0, columnspan=2) 134 | # 读入数据 135 | reDraw.rawDat = np.mat(CART.loadDataSet('sine.txt')) 136 | reDraw.testDat = np.arange(min(reDraw.rawDat[:, 0]), max(reDraw.rawDat[:, 0]), 0.01) 137 | reDraw(1.0, 10) 138 | # 监听事件 139 | root.mainloop() 140 | -------------------------------------------------------------------------------- /CART_Project6/__pycache__/CART.cpython-36.pyc: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/CART_Project6/__pycache__/CART.cpython-36.pyc -------------------------------------------------------------------------------- /DecisionTree_Project1/classifierStorage.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/DecisionTree_Project1/classifierStorage.txt -------------------------------------------------------------------------------- /DecisionTree_Project2/DecisionTree.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Tue Jul 17 21:52:06 2018 4 | 数据的Labels依次是age、prescript、astigmatic、tearRate、class 5 | 年龄、症状、是否散光、眼泪数量、分类标签 6 | @author: wzy 7 | """ 8 | from sklearn.preprocessing import LabelEncoder, OneHotEncoder 9 | import pandas as pd 10 | import numpy as np 11 | import pydotplus 12 | from sklearn.externals.six import StringIO 13 | from sklearn import tree 14 | 15 | if __name__ == '__main__': 16 | # 加载文件 17 | with open('lenses.txt') as fr: 18 | # 处理文件,去掉每行两头的空白符,以\t分隔每个数据 19 | lenses = [inst.strip().split('\t') for inst in fr.readlines()] 20 | # 提取每组数据的类别,保存在列表里 21 | lenses_targt = [] 22 | for each in lenses: 23 | # 存储Label到lenses_targt中 24 | lenses_targt.append([each[-1]]) 25 | # 特征标签 26 | lensesLabels = ['age', 'prescript', 'astigmatic', 'tearRate'] 27 | # 保存lenses数据的临时列表 28 | lenses_list = [] 29 | # 保存lenses数据的字典,用于生成pandas 30 | lenses_dict = {} 31 | # 提取信息,生成字典 32 | for each_label in lensesLabels: 33 | for each in lenses: 34 | # index方法用于从列表中找出某个值第一个匹配项的索引位置 35 | lenses_list.append(each[lensesLabels.index(each_label)]) 36 | lenses_dict[each_label] = lenses_list 37 | lenses_list = [] 38 | # 打印字典信息 39 | # print(lenses_dict) 40 | # 生成pandas.DataFrame用于对象的创建 41 | lenses_pd = pd.DataFrame(lenses_dict) 42 | # 打印数据 43 | # print(lenses_pd) 44 | # 创建LabelEncoder对象 45 | le = LabelEncoder() 46 | # 为每一列序列化 47 | for col in lenses_pd.columns: 48 | # fit_transform()干了两件事:fit找到数据转换规则,并将数据标准化 49 | # transform()直接把转换规则拿来用,需要先进行fit 50 | # transform函数是一定可以替换为fit_transform函数的,fit_transform函数不能替换为transform函数 51 | lenses_pd[col] = le.fit_transform(lenses_pd[col]) 52 | # 打印归一化的结果 53 | # print(lenses_pd) 54 | # 创建DecisionTreeClassifier()类 55 | clf = tree.DecisionTreeClassifier(criterion='entropy', max_depth=4) 56 | # 使用数据构造决策树 57 | # fit(X,y):Build a decision tree classifier from the training set(X,y) 58 | # 所有的sklearn的API必须先fit 59 | clf = clf.fit(lenses_pd.values.tolist(), lenses_targt) 60 | dot_data = StringIO() 61 | # 绘制决策树 62 | tree.export_graphviz(clf, out_file=dot_data, feature_names=lenses_pd.keys(), 63 | class_names=clf.classes_, filled=True, rounded=True, 64 | special_characters=True) 65 | graph = pydotplus.graph_from_dot_data(dot_data.getvalue()) 66 | # 保存绘制好的决策树,以PDF的形式存储。 67 | graph.write_pdf("tree.pdf") 68 | #预测 69 | print(clf.predict([[1,1,1,0]])) 70 | -------------------------------------------------------------------------------- /DecisionTree_Project2/lenses.txt: -------------------------------------------------------------------------------- 1 | young myope no reduced no lenses 2 | young myope no normal soft 3 | young myope yes reduced no lenses 4 | young myope yes normal hard 5 | young hyper no reduced no lenses 6 | young hyper no normal soft 7 | young hyper yes reduced no lenses 8 | young hyper yes normal hard 9 | pre myope no reduced no lenses 10 | pre myope no normal soft 11 | pre myope yes reduced no lenses 12 | pre myope yes normal hard 13 | pre hyper no reduced no lenses 14 | pre hyper no normal soft 15 | pre hyper yes reduced no lenses 16 | pre hyper yes normal no lenses 17 | presbyopic myope no reduced no lenses 18 | presbyopic myope no normal no lenses 19 | presbyopic myope yes reduced no lenses 20 | presbyopic myope yes normal hard 21 | presbyopic hyper no reduced no lenses 22 | presbyopic hyper no normal soft 23 | presbyopic hyper yes reduced no lenses 24 | presbyopic hyper yes normal no lenses 25 | -------------------------------------------------------------------------------- /DecisionTree_Project2/tree.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/DecisionTree_Project2/tree.pdf -------------------------------------------------------------------------------- /EM_Project1/EM_towcoins.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Wed Aug 29 11:04:53 2018 4 | 5 | @author: wzy 6 | """ 7 | import numpy as np 8 | from scipy.stats import binom 9 | 10 | # 采集数据,1表示正面,0表示反面 11 | observations = np.array([[1, 0, 0, 0, 1, 1, 0, 1, 0, 1], 12 | [1, 1, 1, 1, 0, 1, 1, 1, 0, 1], 13 | [1, 0, 1, 1, 1, 1, 1, 0, 1, 1], 14 | [1, 0, 1, 0, 0, 0, 1, 1, 0, 0], 15 | [0, 1, 1, 1, 0, 1, 1, 1, 0, 1]]) 16 | 17 | 18 | """ 19 | 函数说明:EM算法单次迭代 20 | 21 | Parameters: 22 | priors - [theta_A, theta_B]A、B各自为正面向上的概率 23 | observations - 数据矩阵 24 | 25 | Returns: 26 | [new_theta_A, new_theta_B] - 新的A、B各自为正面向上的概率 27 | 28 | Modify: 29 | 2018-08-29 30 | """ 31 | def em_single(priors, observations): 32 | counts = {'A': {'H': 0, 'T': 0}, 'B': {'H': 0, 'T': 0}} 33 | theta_A = priors[0] 34 | theta_B = priors[1] 35 | # E-step 36 | for observation in observations: 37 | len_observation = len(observation) 38 | num_heads = observation.sum() 39 | num_tails = len_observation - num_heads 40 | # 二项分布求解公式 41 | contribution_A = binom.pmf(num_heads, len_observation, theta_A) 42 | contribution_B = binom.pmf(num_heads, len_observation, theta_B) 43 | # 计算两个概率 44 | weight_A = contribution_A / (contribution_A + contribution_B) 45 | weight_B = contribution_B / (contribution_A + contribution_B) 46 | # 估计数据中A、B硬币产生的正反面次数 47 | counts['A']['H'] += weight_A * num_heads 48 | counts['A']['T'] += weight_A * num_tails 49 | counts['B']['H'] += weight_B * num_heads 50 | counts['B']['T'] += weight_B * num_tails 51 | # M-step 52 | # 计算新模型的参数 53 | new_theta_A = counts['A']['H'] / (counts['A']['H'] + counts['A']['T']) 54 | new_theta_B = counts['B']['H'] / (counts['B']['H'] + counts['B']['T']) 55 | return [new_theta_A, new_theta_B] 56 | 57 | 58 | """ 59 | 函数说明:EM算法主循环 60 | 61 | Parameters: 62 | prior - [theta_A, theta_B]A、B各自为正面向上的概率初值 63 | observations - 数据矩阵 64 | tol - 迭代结束的阈值 65 | iterations - 最大迭代次数 66 | 67 | Returns: 68 | [new_prior, iteration] - 局部最优的模型参数,最新的A、B各自为正面向上的概率以及收敛时迭代次数 69 | 70 | Modify: 71 | 2018-08-29 72 | """ 73 | def em(observations, prior, tol=1e-6, iterations=10000): 74 | iteration = 0 75 | while iteration < iterations: 76 | new_prior = em_single(prior, observations) 77 | delta_change = np.abs(prior[0] - new_prior[0]) 78 | if delta_change < tol: 79 | break 80 | else: 81 | prior = new_prior 82 | iteration += 1 83 | return [new_prior, iteration] 84 | 85 | 86 | if __name__ == '__main__': 87 | print(em(observations, [0.99999, 0.00001])) 88 | -------------------------------------------------------------------------------- /FP_Growth_Project2/__pycache__/FP_Growth.cpython-36.pyc: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/FP_Growth_Project2/__pycache__/FP_Growth.cpython-36.pyc -------------------------------------------------------------------------------- /FP_Growth_Project2/main.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Mon Aug 6 20:28:06 2018 4 | 5 | @author: wzy 6 | """ 7 | import FP_Growth 8 | 9 | # 导入数据 10 | parsedDat = [line.split() for line in open('kosarak.dat').readlines()] 11 | # 数据初始化为字典 12 | initSet = FP_Growth.createInitSet(parsedDat) 13 | # 创建FP树 14 | myFPtree, myHeaderTab = FP_Growth.createTree(initSet, 100000) 15 | myFreqList = [] 16 | # 查找频繁项集,查找至少被10万人浏览过的新闻报道 17 | FP_Growth.mineTree(myFPtree, myHeaderTab, 100000, set([]), myFreqList) 18 | # 打印频繁项集(哪些报道浏览量达到支持度) 19 | print(myFreqList) 20 | -------------------------------------------------------------------------------- /K_Means_Project1/Figure_1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/K_Means_Project1/Figure_1.png -------------------------------------------------------------------------------- /K_Means_Project1/testSet.txt: -------------------------------------------------------------------------------- 1 | 1.658985 4.285136 2 | -3.453687 3.424321 3 | 4.838138 -1.151539 4 | -5.379713 -3.362104 5 | 0.972564 2.924086 6 | -3.567919 1.531611 7 | 0.450614 -3.302219 8 | -3.487105 -1.724432 9 | 2.668759 1.594842 10 | -3.156485 3.191137 11 | 3.165506 -3.999838 12 | -2.786837 -3.099354 13 | 4.208187 2.984927 14 | -2.123337 2.943366 15 | 0.704199 -0.479481 16 | -0.392370 -3.963704 17 | 2.831667 1.574018 18 | -0.790153 3.343144 19 | 2.943496 -3.357075 20 | -3.195883 -2.283926 21 | 2.336445 2.875106 22 | -1.786345 2.554248 23 | 2.190101 -1.906020 24 | -3.403367 -2.778288 25 | 1.778124 3.880832 26 | -1.688346 2.230267 27 | 2.592976 -2.054368 28 | -4.007257 -3.207066 29 | 2.257734 3.387564 30 | -2.679011 0.785119 31 | 0.939512 -4.023563 32 | -3.674424 -2.261084 33 | 2.046259 2.735279 34 | -3.189470 1.780269 35 | 4.372646 -0.822248 36 | -2.579316 -3.497576 37 | 1.889034 5.190400 38 | -0.798747 2.185588 39 | 2.836520 -2.658556 40 | -3.837877 -3.253815 41 | 2.096701 3.886007 42 | -2.709034 2.923887 43 | 3.367037 -3.184789 44 | -2.121479 -4.232586 45 | 2.329546 3.179764 46 | -3.284816 3.273099 47 | 3.091414 -3.815232 48 | -3.762093 -2.432191 49 | 3.542056 2.778832 50 | -1.736822 4.241041 51 | 2.127073 -2.983680 52 | -4.323818 -3.938116 53 | 3.792121 5.135768 54 | -4.786473 3.358547 55 | 2.624081 -3.260715 56 | -4.009299 -2.978115 57 | 2.493525 1.963710 58 | -2.513661 2.642162 59 | 1.864375 -3.176309 60 | -3.171184 -3.572452 61 | 2.894220 2.489128 62 | -2.562539 2.884438 63 | 3.491078 -3.947487 64 | -2.565729 -2.012114 65 | 3.332948 3.983102 66 | -1.616805 3.573188 67 | 2.280615 -2.559444 68 | -2.651229 -3.103198 69 | 2.321395 3.154987 70 | -1.685703 2.939697 71 | 3.031012 -3.620252 72 | -4.599622 -2.185829 73 | 4.196223 1.126677 74 | -2.133863 3.093686 75 | 4.668892 -2.562705 76 | -2.793241 -2.149706 77 | 2.884105 3.043438 78 | -2.967647 2.848696 79 | 4.479332 -1.764772 80 | -4.905566 -2.911070 81 | -------------------------------------------------------------------------------- /K_Means_Project2/Figure_1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/K_Means_Project2/Figure_1.png -------------------------------------------------------------------------------- /K_Means_Project2/testSet2.txt: -------------------------------------------------------------------------------- 1 | 3.275154 2.957587 2 | -3.344465 2.603513 3 | 0.355083 -3.376585 4 | 1.852435 3.547351 5 | -2.078973 2.552013 6 | -0.993756 -0.884433 7 | 2.682252 4.007573 8 | -3.087776 2.878713 9 | -1.565978 -1.256985 10 | 2.441611 0.444826 11 | -0.659487 3.111284 12 | -0.459601 -2.618005 13 | 2.177680 2.387793 14 | -2.920969 2.917485 15 | -0.028814 -4.168078 16 | 3.625746 2.119041 17 | -3.912363 1.325108 18 | -0.551694 -2.814223 19 | 2.855808 3.483301 20 | -3.594448 2.856651 21 | 0.421993 -2.372646 22 | 1.650821 3.407572 23 | -2.082902 3.384412 24 | -0.718809 -2.492514 25 | 4.513623 3.841029 26 | -4.822011 4.607049 27 | -0.656297 -1.449872 28 | 1.919901 4.439368 29 | -3.287749 3.918836 30 | -1.576936 -2.977622 31 | 3.598143 1.975970 32 | -3.977329 4.900932 33 | -1.791080 -2.184517 34 | 3.914654 3.559303 35 | -1.910108 4.166946 36 | -1.226597 -3.317889 37 | 1.148946 3.345138 38 | -2.113864 3.548172 39 | 0.845762 -3.589788 40 | 2.629062 3.535831 41 | -1.640717 2.990517 42 | -1.881012 -2.485405 43 | 4.606999 3.510312 44 | -4.366462 4.023316 45 | 0.765015 -3.001270 46 | 3.121904 2.173988 47 | -4.025139 4.652310 48 | -0.559558 -3.840539 49 | 4.376754 4.863579 50 | -1.874308 4.032237 51 | -0.089337 -3.026809 52 | 3.997787 2.518662 53 | -3.082978 2.884822 54 | 0.845235 -3.454465 55 | 1.327224 3.358778 56 | -2.889949 3.596178 57 | -0.966018 -2.839827 58 | 2.960769 3.079555 59 | -3.275518 1.577068 60 | 0.639276 -3.412840 61 | -------------------------------------------------------------------------------- /K_Means_Project3/Figure_1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/K_Means_Project3/Figure_1.png -------------------------------------------------------------------------------- /K_Means_Project3/Portland.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/K_Means_Project3/Portland.png -------------------------------------------------------------------------------- /K_Means_Project3/__pycache__/KMeans.cpython-36.pyc: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/K_Means_Project3/__pycache__/KMeans.cpython-36.pyc -------------------------------------------------------------------------------- /K_Means_Project3/portlandClubs.txt: -------------------------------------------------------------------------------- 1 | Dolphin II 10860 SW Beaverton-Hillsdale Hwy Beaverton, OR 2 | Hotties 10140 SW Canyon Rd. Beaverton, OR 3 | Pussycats 8666a SW Canyon Road Beaverton, OR 4 | Stars Cabaret 4570 Lombard Ave Beaverton, OR 5 | Sunset Strip 10205 SW Park Way Beaverton, OR 6 | Vegas VIP Room 10018 SW Canyon Rd Beaverton, OR 7 | Full Moon Bar and Grill 28014 Southeast Wally Road Boring, OR 8 | 505 Club 505 Burnside Rd Gresham, OR 9 | Dolphin 17180 McLoughlin Blvd Milwaukie, OR 10 | Dolphin III 13305 SE McLoughlin BLVD Milwaukie, OR 11 | Acropolis 8325 McLoughlin Blvd Portland, OR 12 | Blush 5145 SE McLoughlin Blvd Portland, OR 13 | Boom Boom Room 8345 Barbur Blvd Portland, OR 14 | Bottoms Up 16900 Saint Helens Rd Portland, OR 15 | Cabaret II 17544 Stark St Portland, OR 16 | Cabaret Lounge 503 W Burnside Portland, OR 17 | Carnaval 330 SW 3rd Avenue Portland, OR 18 | Casa Diablo 2839 NW St. Helens Road Portland, OR 19 | Chantilly Lace 6723 Killingsworth St Portland, OR 20 | Club 205 9939 Stark St Portland, OR 21 | Club Rouge 403 SW Stark Portland, OR 22 | Dancin' Bare 8440 Interstate Ave Portland, OR 23 | Devil's Point 5305 SE Foster Rd Portland, OR 24 | Double Dribble 13550 Southeast Powell Boulevard Portland, OR 25 | Dream on Saloon 15920 Stark St Portland, OR 26 | DV8 5003 Powell Blvd Portland, OR 27 | Exotica 240 Columbia Blvd Portland, OR 28 | Frolics 8845 Sandy Blvd Portland, OR 29 | G-Spot Airport 8654 Sandy Blvd Portland, OR 30 | G-Spot Northeast 3400 NE 82nd Ave Portland, OR 31 | G-Spot Southeast 5241 SE 72nd Ave Portland, OR 32 | Glimmers 3532 Powell Blvd Portland, OR 33 | Golden Dragon Exotic Club 324 SW 3rd Ave Portland, OR 34 | Heat 12131 SE Holgate Blvd. Portland, OR 35 | Honeysuckle's Lingerie 3520 82nd Ave Portland, OR 36 | Hush Playhouse 13560 Powell Blvd Portland, OR 37 | JD's Bar & Grill 4523 NE 60th Ave Portland, OR 38 | Jody's Bar And Grill 12035 Glisan St Portland, OR 39 | Landing Strip 6210 Columbia Blvd Portland, OR 40 | Lucky Devil Lounge 633 SE Powell Blvd Portland, OR 41 | Lure 11051 Barbur Blvd Portland, OR 42 | Magic Garden 217 4th Ave Portland, OR 43 | Mary's Club 129 Broadway Portland, OR 44 | Montego's 15826 SE Division Portland, OR 45 | Mr. Peeps 709 122nd Ave Portland, OR 46 | Mynt Gentlemen's Club 3390 NE Sandy Blvd Portland, OR 47 | Mystic 9950 SE Stark St. Portland, OR 48 | Nicolai Street Clubhouse 2460 24th Ave Portland, OR 49 | Oh Zone 6218 Columbia Blvd Portland, OR 50 | Pallas Club 13639 Powell Blvd Portland, OR 51 | Pirates Cove 7427 Sandy Blvd Portland, OR 52 | Private Pleasures 10931 53rd Ave Portland, OR 53 | Pussycats 3414 Northeast 82nd Avenue Portland, OR 54 | Riverside Corral 545 Tacoma St Portland, OR 55 | Rooster's 605 Columbia Blvd Portland, OR 56 | Rose City Strip 3620 35th Pl Portland, OR 57 | Safari Show Club 3000 SE Powell Blvd Portland, OR 58 | Sassy's Bar & Grill 927 Morrison St Portland, OR 59 | Secret Rendezvous 12503 Division St Portland, OR 60 | Shimmers 7944 Foster Rd Portland, OR 61 | Soobie's 333 SE 122nd Ave Portland, OR 62 | Spyce Gentleman's Club 33 NW 2nd Ave Portland, OR 63 | Sugar Shack 6732 Killingsworth St Portland, OR 64 | The Hawthorne Strip 1008 Hawthorne Blvd Portland, OR 65 | Tommy's Too 10335 Foster Rd Portland, OR 66 | Union Jacks 938 Burnside St Portland, OR 67 | Video Visions 6723 Killingsworth St Portland, OR 68 | Stars Cabaret Bridgeport 17939 SW McEwan Rd Tigard, OR 69 | Jiggles 7455 SW Nyberg St Tualatin, OR -------------------------------------------------------------------------------- /K_Means_Project4/Figure_1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/K_Means_Project4/Figure_1.png -------------------------------------------------------------------------------- /K_Means_Project4/K_Means.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Sat Aug 4 15:55:01 2018 4 | 5 | @author: wzy 6 | """ 7 | # 聚类数据生成器 8 | from sklearn.datasets import make_blobs 9 | # KMeans算法使用 10 | from sklearn.cluster import KMeans 11 | import matplotlib.pyplot as plt 12 | 13 | if __name__ == '__main__': 14 | # 生成聚类数据 150个样本,每个样本两个特征,一共聚为3簇,簇内标准差为0.5,所有样本数据随机排序,采用随机数种子 15 | x, y = make_blobs(n_samples=150, n_features=2, centers=3, cluster_std=0.5, shuffle=True, random_state=0) 16 | # 绘制样本点的散点图 17 | plt.scatter(x[:, 0], x[:, 1], marker='o', color='blue') 18 | # 聚为3个簇,从训练数据用k-means++寻找质心,初始样本中心的个数为10个,最大迭代次数为300,SSE为10^(-4) 19 | km = KMeans(n_clusters=3, init="k-means++", n_init=10, max_iter=300, tol=1e-4, random_state=0) 20 | # 用K-means计算并且将X作为测试集分簇 21 | y_km = km.fit_predict(x) 22 | # 绘制不同簇的点 23 | plt.scatter(x[y_km==0, 0], x[y_km==0, 1], s=50, c='orange', marker='o', label='cluster 1') 24 | plt.scatter(x[y_km==1, 0], x[y_km==1, 1], s=50, c='green', marker='s', label='cluster 2') 25 | plt.scatter(x[y_km==2, 0], x[y_km==2, 1], s=50, c='blue', marker='^', label='cluster 3') 26 | # 绘制簇的中心点 27 | plt.scatter(km.cluster_centers_[:, 0], km.cluster_centers_[:, 1], s=250, marker="*", c="red", label="cluster center") 28 | plt.legend() 29 | plt.grid() 30 | plt.show() 31 | -------------------------------------------------------------------------------- /LinearRegression_Project1/LinearRegression.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Sun Jul 29 16:03:37 2018 4 | 5 | @author: wzy 6 | """ 7 | import matplotlib.pyplot as plt 8 | import numpy as np 9 | 10 | """ 11 | 函数说明:加载数据 12 | 13 | Parameters: 14 | filename - 文件名 15 | 16 | Returns: 17 | xArr - x数据集 18 | yArr - y数据集 19 | 20 | Modify: 21 | 2018-07-29 22 | """ 23 | def loadDataSet(filename): 24 | # 计算特征个数,由于最后一列为y值所以减一 25 | numFeat = len(open(filename).readline().split('\t')) - 1 26 | xArr = [] 27 | yArr = [] 28 | fr = open(filename) 29 | for line in fr.readlines(): 30 | lineArr = [] 31 | curLine = line.strip().split('\t') 32 | for i in range(numFeat): 33 | lineArr.append(float(curLine[i])) 34 | xArr.append(lineArr) 35 | yArr.append(float(curLine[-1])) 36 | return xArr, yArr 37 | 38 | 39 | """ 40 | 函数说明:计算回归系数w 41 | 42 | Parameters: 43 | xArr - x数据集 44 | yArr - y数据集 45 | 46 | Returns: 47 | ws - 回归系数 48 | 49 | Modify: 50 | 2018-07-29 51 | """ 52 | def standRegres(xArr, yArr): 53 | xMat = np.mat(xArr) 54 | yMat = np.mat(yArr).T 55 | xTx = xMat.T * xMat 56 | # 求矩阵的行列式 57 | if np.linalg.det(xTx) == 0.0: 58 | print("矩阵为奇异矩阵,不能求逆") 59 | return 60 | # .I求逆矩阵 61 | ws = (xTx.I) * (xMat.T) * yMat 62 | return ws 63 | 64 | 65 | """ 66 | 函数说明:绘制数据集 67 | 68 | Parameters: 69 | None 70 | 71 | Returns: 72 | None 73 | 74 | Modify: 75 | 2018-07-29 76 | """ 77 | def plotDataSet(): 78 | xArr, yArr = loadDataSet('ex0.txt') 79 | ws = standRegres(xArr, yArr) 80 | xMat = np.mat(xArr) 81 | yMat = np.mat(yArr) 82 | xCopy = xMat.copy() 83 | # 排序 84 | xCopy.sort(0) 85 | yHat = xCopy * ws 86 | # 以下两行是通过corrcoef函数比较预测值和真实值的相关性 87 | # corrcoef函数得到相关系数矩阵 88 | # 得到的结果中对角线上的数据是1.0,因为yMat和自己的匹配是完美的 89 | # 而yHat1和yMat的相关系数为0.98 90 | yHat1 = xMat * ws 91 | print(np.corrcoef(yHat1.T, yMat)) 92 | fig = plt.figure() 93 | ax = fig.add_subplot(111) 94 | ax.plot(xCopy[:, 1], yHat, c='red') 95 | # 绘制样本点即 96 | # flatten返回一个折叠成一维的数组。但是该函数只能适用于numpy对象,即array或者mat,普通的list列表是不行的 97 | # 矩阵.A(等效于矩阵.getA())变成了数组 98 | ax.scatter(xMat[:, 1].flatten().A[0], yMat.flatten().A[0], s=20, c='blue', alpha=.5) 99 | plt.title('DataSet') 100 | plt.xlabel('X') 101 | plt.show() 102 | 103 | 104 | if __name__ == '__main__': 105 | plotDataSet() 106 | -------------------------------------------------------------------------------- /Logistic_Project1/testSet.txt: -------------------------------------------------------------------------------- 1 | -0.017612 14.053064 0 2 | -1.395634 4.662541 1 3 | -0.752157 6.538620 0 4 | -1.322371 7.152853 0 5 | 0.423363 11.054677 0 6 | 0.406704 7.067335 1 7 | 0.667394 12.741452 0 8 | -2.460150 6.866805 1 9 | 0.569411 9.548755 0 10 | -0.026632 10.427743 0 11 | 0.850433 6.920334 1 12 | 1.347183 13.175500 0 13 | 1.176813 3.167020 1 14 | -1.781871 9.097953 0 15 | -0.566606 5.749003 1 16 | 0.931635 1.589505 1 17 | -0.024205 6.151823 1 18 | -0.036453 2.690988 1 19 | -0.196949 0.444165 1 20 | 1.014459 5.754399 1 21 | 1.985298 3.230619 1 22 | -1.693453 -0.557540 1 23 | -0.576525 11.778922 0 24 | -0.346811 -1.678730 1 25 | -2.124484 2.672471 1 26 | 1.217916 9.597015 0 27 | -0.733928 9.098687 0 28 | -3.642001 -1.618087 1 29 | 0.315985 3.523953 1 30 | 1.416614 9.619232 0 31 | -0.386323 3.989286 1 32 | 0.556921 8.294984 1 33 | 1.224863 11.587360 0 34 | -1.347803 -2.406051 1 35 | 1.196604 4.951851 1 36 | 0.275221 9.543647 0 37 | 0.470575 9.332488 0 38 | -1.889567 9.542662 0 39 | -1.527893 12.150579 0 40 | -1.185247 11.309318 0 41 | -0.445678 3.297303 1 42 | 1.042222 6.105155 1 43 | -0.618787 10.320986 0 44 | 1.152083 0.548467 1 45 | 0.828534 2.676045 1 46 | -1.237728 10.549033 0 47 | -0.683565 -2.166125 1 48 | 0.229456 5.921938 1 49 | -0.959885 11.555336 0 50 | 0.492911 10.993324 0 51 | 0.184992 8.721488 0 52 | -0.355715 10.325976 0 53 | -0.397822 8.058397 0 54 | 0.824839 13.730343 0 55 | 1.507278 5.027866 1 56 | 0.099671 6.835839 1 57 | -0.344008 10.717485 0 58 | 1.785928 7.718645 1 59 | -0.918801 11.560217 0 60 | -0.364009 4.747300 1 61 | -0.841722 4.119083 1 62 | 0.490426 1.960539 1 63 | -0.007194 9.075792 0 64 | 0.356107 12.447863 0 65 | 0.342578 12.281162 0 66 | -0.810823 -1.466018 1 67 | 2.530777 6.476801 1 68 | 1.296683 11.607559 0 69 | 0.475487 12.040035 0 70 | -0.783277 11.009725 0 71 | 0.074798 11.023650 0 72 | -1.337472 0.468339 1 73 | -0.102781 13.763651 0 74 | -0.147324 2.874846 1 75 | 0.518389 9.887035 0 76 | 1.015399 7.571882 0 77 | -1.658086 -0.027255 1 78 | 1.319944 2.171228 1 79 | 2.056216 5.019981 1 80 | -0.851633 4.375691 1 81 | -1.510047 6.061992 0 82 | -1.076637 -3.181888 1 83 | 1.821096 10.283990 0 84 | 3.010150 8.401766 1 85 | -1.099458 1.688274 1 86 | -0.834872 -1.733869 1 87 | -0.846637 3.849075 1 88 | 1.400102 12.628781 0 89 | 1.752842 5.468166 1 90 | 0.078557 0.059736 1 91 | 0.089392 -0.715300 1 92 | 1.825662 12.693808 0 93 | 0.197445 9.744638 0 94 | 0.126117 0.922311 1 95 | -0.679797 1.220530 1 96 | 0.677983 2.556666 1 97 | 0.761349 10.693862 0 98 | -2.168791 0.143632 1 99 | 1.388610 9.341997 0 100 | 0.317029 14.739025 0 101 | -------------------------------------------------------------------------------- /Logistic_Project2/horseColicTest.txt: -------------------------------------------------------------------------------- 1 | 2 1 38.50 54 20 0 1 2 2 3 4 1 2 2 5.90 0 2 42.00 6.30 0 0 1 2 | 2 1 37.60 48 36 0 0 1 1 0 3 0 0 0 0 0 0 44.00 6.30 1 5.00 1 3 | 1 1 37.7 44 28 0 4 3 2 5 4 4 1 1 0 3 5 45 70 3 2 1 4 | 1 1 37 56 24 3 1 4 2 4 4 3 1 1 0 0 0 35 61 3 2 0 5 | 2 1 38.00 42 12 3 0 3 1 1 0 1 0 0 0 0 2 37.00 5.80 0 0 1 6 | 1 1 0 60 40 3 0 1 1 0 4 0 3 2 0 0 5 42 72 0 0 1 7 | 2 1 38.40 80 60 3 2 2 1 3 2 1 2 2 0 1 1 54.00 6.90 0 0 1 8 | 2 1 37.80 48 12 2 1 2 1 3 0 1 2 0 0 2 0 48.00 7.30 1 0 1 9 | 2 1 37.90 45 36 3 3 3 2 2 3 1 2 1 0 3 0 33.00 5.70 3 0 1 10 | 2 1 39.00 84 12 3 1 5 1 2 4 2 1 2 7.00 0 4 62.00 5.90 2 2.20 0 11 | 2 1 38.20 60 24 3 1 3 2 3 3 2 3 3 0 4 4 53.00 7.50 2 1.40 1 12 | 1 1 0 140 0 0 0 4 2 5 4 4 1 1 0 0 5 30 69 0 0 0 13 | 1 1 37.90 120 60 3 3 3 1 5 4 4 2 2 7.50 4 5 52.00 6.60 3 1.80 0 14 | 2 1 38.00 72 36 1 1 3 1 3 0 2 2 1 0 3 5 38.00 6.80 2 2.00 1 15 | 2 9 38.00 92 28 1 1 2 1 1 3 2 3 0 7.20 0 0 37.00 6.10 1 1.10 1 16 | 1 1 38.30 66 30 2 3 1 1 2 4 3 3 2 8.50 4 5 37.00 6.00 0 0 1 17 | 2 1 37.50 48 24 3 1 1 1 2 1 0 1 1 0 3 2 43.00 6.00 1 2.80 1 18 | 1 1 37.50 88 20 2 3 3 1 4 3 3 0 0 0 0 0 35.00 6.40 1 0 0 19 | 2 9 0 150 60 4 4 4 2 5 4 4 0 0 0 0 0 0 0 0 0 0 20 | 1 1 39.7 100 30 0 0 6 2 4 4 3 1 0 0 4 5 65 75 0 0 0 21 | 1 1 38.30 80 0 3 3 4 2 5 4 3 2 1 0 4 4 45.00 7.50 2 4.60 1 22 | 2 1 37.50 40 32 3 1 3 1 3 2 3 2 1 0 0 5 32.00 6.40 1 1.10 1 23 | 1 1 38.40 84 30 3 1 5 2 4 3 3 2 3 6.50 4 4 47.00 7.50 3 0 0 24 | 1 1 38.10 84 44 4 0 4 2 5 3 1 1 3 5.00 0 4 60.00 6.80 0 5.70 0 25 | 2 1 38.70 52 0 1 1 1 1 1 3 1 0 0 0 1 3 4.00 74.00 0 0 1 26 | 2 1 38.10 44 40 2 1 3 1 3 3 1 0 0 0 1 3 35.00 6.80 0 0 1 27 | 2 1 38.4 52 20 2 1 3 1 1 3 2 2 1 0 3 5 41 63 1 1 1 28 | 1 1 38.20 60 0 1 0 3 1 2 1 1 1 1 0 4 4 43.00 6.20 2 3.90 1 29 | 2 1 37.70 40 18 1 1 1 0 3 2 1 1 1 0 3 3 36.00 3.50 0 0 1 30 | 1 1 39.1 60 10 0 1 1 0 2 3 0 0 0 0 4 4 0 0 0 0 1 31 | 2 1 37.80 48 16 1 1 1 1 0 1 1 2 1 0 4 3 43.00 7.50 0 0 1 32 | 1 1 39.00 120 0 4 3 5 2 2 4 3 2 3 8.00 0 0 65.00 8.20 3 4.60 1 33 | 1 1 38.20 76 0 2 3 2 1 5 3 3 1 2 6.00 1 5 35.00 6.50 2 0.90 1 34 | 2 1 38.30 88 0 0 0 6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 35 | 1 1 38.00 80 30 3 3 3 1 0 0 0 0 0 6.00 0 0 48.00 8.30 0 4.30 1 36 | 1 1 0 0 0 3 1 1 1 2 3 3 1 3 6.00 4 4 0 0 2 0 0 37 | 1 1 37.60 40 0 1 1 1 1 1 1 1 0 0 0 1 1 0 0 2 2.10 1 38 | 2 1 37.50 44 0 1 1 1 1 3 3 2 0 0 0 0 0 45.00 5.80 2 1.40 1 39 | 2 1 38.2 42 16 1 1 3 1 1 3 1 0 0 0 1 0 35 60 1 1 1 40 | 2 1 38 56 44 3 3 3 0 0 1 1 2 1 0 4 0 47 70 2 1 1 41 | 2 1 38.30 45 20 3 3 2 2 2 4 1 2 0 0 4 0 0 0 0 0 1 42 | 1 1 0 48 96 1 1 3 1 0 4 1 2 1 0 1 4 42.00 8.00 1 0 1 43 | 1 1 37.70 55 28 2 1 2 1 2 3 3 0 3 5.00 4 5 0 0 0 0 1 44 | 2 1 36.00 100 20 4 3 6 2 2 4 3 1 1 0 4 5 74.00 5.70 2 2.50 0 45 | 1 1 37.10 60 20 2 0 4 1 3 0 3 0 2 5.00 3 4 64.00 8.50 2 0 1 46 | 2 1 37.10 114 40 3 0 3 2 2 2 1 0 0 0 0 3 32.00 0 3 6.50 1 47 | 1 1 38.1 72 30 3 3 3 1 4 4 3 2 1 0 3 5 37 56 3 1 1 48 | 1 1 37.00 44 12 3 1 1 2 1 1 1 0 0 0 4 2 40.00 6.70 3 8.00 1 49 | 1 1 38.6 48 20 3 1 1 1 4 3 1 0 0 0 3 0 37 75 0 0 1 50 | 1 1 0 82 72 3 1 4 1 2 3 3 0 3 0 4 4 53 65 3 2 0 51 | 1 9 38.20 78 60 4 4 6 0 3 3 3 0 0 0 1 0 59.00 5.80 3 3.10 0 52 | 2 1 37.8 60 16 1 1 3 1 2 3 2 1 2 0 3 0 41 73 0 0 0 53 | 1 1 38.7 34 30 2 0 3 1 2 3 0 0 0 0 0 0 33 69 0 2 0 54 | 1 1 0 36 12 1 1 1 1 1 2 1 1 1 0 1 5 44.00 0 0 0 1 55 | 2 1 38.30 44 60 0 0 1 1 0 0 0 0 0 0 0 0 6.40 36.00 0 0 1 56 | 2 1 37.40 54 18 3 0 1 1 3 4 3 2 2 0 4 5 30.00 7.10 2 0 1 57 | 1 1 0 0 0 4 3 0 2 2 4 1 0 0 0 0 0 54 76 3 2 1 58 | 1 1 36.6 48 16 3 1 3 1 4 1 1 1 1 0 0 0 27 56 0 0 0 59 | 1 1 38.5 90 0 1 1 3 1 3 3 3 2 3 2 4 5 47 79 0 0 1 60 | 1 1 0 75 12 1 1 4 1 5 3 3 0 3 5.80 0 0 58.00 8.50 1 0 1 61 | 2 1 38.20 42 0 3 1 1 1 1 1 2 2 1 0 3 2 35.00 5.90 2 0 1 62 | 1 9 38.20 78 60 4 4 6 0 3 3 3 0 0 0 1 0 59.00 5.80 3 3.10 0 63 | 2 1 38.60 60 30 1 1 3 1 4 2 2 1 1 0 0 0 40.00 6.00 1 0 1 64 | 2 1 37.80 42 40 1 1 1 1 1 3 1 0 0 0 3 3 36.00 6.20 0 0 1 65 | 1 1 38 60 12 1 1 2 1 2 1 1 1 1 0 1 4 44 65 3 2 0 66 | 2 1 38.00 42 12 3 0 3 1 1 1 1 0 0 0 0 1 37.00 5.80 0 0 1 67 | 2 1 37.60 88 36 3 1 1 1 3 3 2 1 3 1.50 0 0 44.00 6.00 0 0 0 -------------------------------------------------------------------------------- /Logistic_Project3/Logistic.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Sun Jul 22 17:53:31 2018 4 | 5 | @author: wzy 6 | """ 7 | from sklearn.linear_model import LogisticRegression 8 | 9 | """ 10 | 函数说明:使用Sklearn构建Logistic回归分类器 11 | 12 | Parameters: 13 | None 14 | 15 | Returns: 16 | None 17 | 18 | Modify: 19 | 2018-07-22 20 | """ 21 | def colicSklearn(): 22 | # 打开训练集 23 | frTrain = open('horseColicTraining.txt') 24 | # 打开测试集 25 | frTest = open('horseColicTest.txt') 26 | trainingSet = [] 27 | trainingLabels = [] 28 | testSet = [] 29 | testLabels = [] 30 | for line in frTrain.readlines(): 31 | currLine = line.strip().split('\t') 32 | lineArr = [] 33 | for i in range(len(currLine) - 1): 34 | lineArr.append(float(currLine[i])) 35 | trainingSet.append(lineArr) 36 | trainingLabels.append(float(currLine[-1])) 37 | for line in frTest.readlines(): 38 | currLine = line.strip().split('\t') 39 | lineArr = [] 40 | for i in range(len(currLine) - 1): 41 | lineArr.append(float(currLine[i])) 42 | testSet.append(lineArr) 43 | testLabels.append(float(currLine[-1])) 44 | # fit(X,y) Fit the model according to the given training data 45 | classifier = LogisticRegression(solver='liblinear', max_iter=10).fit(trainingSet, trainingLabels) 46 | # score(X,y) Returns the mean accuracy on the given test data and labels 47 | test_accurcy = classifier.score(testSet, testLabels) * 100 48 | print("正确率为:%f%%" % test_accurcy) 49 | 50 | 51 | if __name__ == '__main__': 52 | colicSklearn() -------------------------------------------------------------------------------- /Logistic_Project3/horseColicTest.txt: -------------------------------------------------------------------------------- 1 | 2 1 38.50 54 20 0 1 2 2 3 4 1 2 2 5.90 0 2 42.00 6.30 0 0 1 2 | 2 1 37.60 48 36 0 0 1 1 0 3 0 0 0 0 0 0 44.00 6.30 1 5.00 1 3 | 1 1 37.7 44 28 0 4 3 2 5 4 4 1 1 0 3 5 45 70 3 2 1 4 | 1 1 37 56 24 3 1 4 2 4 4 3 1 1 0 0 0 35 61 3 2 0 5 | 2 1 38.00 42 12 3 0 3 1 1 0 1 0 0 0 0 2 37.00 5.80 0 0 1 6 | 1 1 0 60 40 3 0 1 1 0 4 0 3 2 0 0 5 42 72 0 0 1 7 | 2 1 38.40 80 60 3 2 2 1 3 2 1 2 2 0 1 1 54.00 6.90 0 0 1 8 | 2 1 37.80 48 12 2 1 2 1 3 0 1 2 0 0 2 0 48.00 7.30 1 0 1 9 | 2 1 37.90 45 36 3 3 3 2 2 3 1 2 1 0 3 0 33.00 5.70 3 0 1 10 | 2 1 39.00 84 12 3 1 5 1 2 4 2 1 2 7.00 0 4 62.00 5.90 2 2.20 0 11 | 2 1 38.20 60 24 3 1 3 2 3 3 2 3 3 0 4 4 53.00 7.50 2 1.40 1 12 | 1 1 0 140 0 0 0 4 2 5 4 4 1 1 0 0 5 30 69 0 0 0 13 | 1 1 37.90 120 60 3 3 3 1 5 4 4 2 2 7.50 4 5 52.00 6.60 3 1.80 0 14 | 2 1 38.00 72 36 1 1 3 1 3 0 2 2 1 0 3 5 38.00 6.80 2 2.00 1 15 | 2 9 38.00 92 28 1 1 2 1 1 3 2 3 0 7.20 0 0 37.00 6.10 1 1.10 1 16 | 1 1 38.30 66 30 2 3 1 1 2 4 3 3 2 8.50 4 5 37.00 6.00 0 0 1 17 | 2 1 37.50 48 24 3 1 1 1 2 1 0 1 1 0 3 2 43.00 6.00 1 2.80 1 18 | 1 1 37.50 88 20 2 3 3 1 4 3 3 0 0 0 0 0 35.00 6.40 1 0 0 19 | 2 9 0 150 60 4 4 4 2 5 4 4 0 0 0 0 0 0 0 0 0 0 20 | 1 1 39.7 100 30 0 0 6 2 4 4 3 1 0 0 4 5 65 75 0 0 0 21 | 1 1 38.30 80 0 3 3 4 2 5 4 3 2 1 0 4 4 45.00 7.50 2 4.60 1 22 | 2 1 37.50 40 32 3 1 3 1 3 2 3 2 1 0 0 5 32.00 6.40 1 1.10 1 23 | 1 1 38.40 84 30 3 1 5 2 4 3 3 2 3 6.50 4 4 47.00 7.50 3 0 0 24 | 1 1 38.10 84 44 4 0 4 2 5 3 1 1 3 5.00 0 4 60.00 6.80 0 5.70 0 25 | 2 1 38.70 52 0 1 1 1 1 1 3 1 0 0 0 1 3 4.00 74.00 0 0 1 26 | 2 1 38.10 44 40 2 1 3 1 3 3 1 0 0 0 1 3 35.00 6.80 0 0 1 27 | 2 1 38.4 52 20 2 1 3 1 1 3 2 2 1 0 3 5 41 63 1 1 1 28 | 1 1 38.20 60 0 1 0 3 1 2 1 1 1 1 0 4 4 43.00 6.20 2 3.90 1 29 | 2 1 37.70 40 18 1 1 1 0 3 2 1 1 1 0 3 3 36.00 3.50 0 0 1 30 | 1 1 39.1 60 10 0 1 1 0 2 3 0 0 0 0 4 4 0 0 0 0 1 31 | 2 1 37.80 48 16 1 1 1 1 0 1 1 2 1 0 4 3 43.00 7.50 0 0 1 32 | 1 1 39.00 120 0 4 3 5 2 2 4 3 2 3 8.00 0 0 65.00 8.20 3 4.60 1 33 | 1 1 38.20 76 0 2 3 2 1 5 3 3 1 2 6.00 1 5 35.00 6.50 2 0.90 1 34 | 2 1 38.30 88 0 0 0 6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 35 | 1 1 38.00 80 30 3 3 3 1 0 0 0 0 0 6.00 0 0 48.00 8.30 0 4.30 1 36 | 1 1 0 0 0 3 1 1 1 2 3 3 1 3 6.00 4 4 0 0 2 0 0 37 | 1 1 37.60 40 0 1 1 1 1 1 1 1 0 0 0 1 1 0 0 2 2.10 1 38 | 2 1 37.50 44 0 1 1 1 1 3 3 2 0 0 0 0 0 45.00 5.80 2 1.40 1 39 | 2 1 38.2 42 16 1 1 3 1 1 3 1 0 0 0 1 0 35 60 1 1 1 40 | 2 1 38 56 44 3 3 3 0 0 1 1 2 1 0 4 0 47 70 2 1 1 41 | 2 1 38.30 45 20 3 3 2 2 2 4 1 2 0 0 4 0 0 0 0 0 1 42 | 1 1 0 48 96 1 1 3 1 0 4 1 2 1 0 1 4 42.00 8.00 1 0 1 43 | 1 1 37.70 55 28 2 1 2 1 2 3 3 0 3 5.00 4 5 0 0 0 0 1 44 | 2 1 36.00 100 20 4 3 6 2 2 4 3 1 1 0 4 5 74.00 5.70 2 2.50 0 45 | 1 1 37.10 60 20 2 0 4 1 3 0 3 0 2 5.00 3 4 64.00 8.50 2 0 1 46 | 2 1 37.10 114 40 3 0 3 2 2 2 1 0 0 0 0 3 32.00 0 3 6.50 1 47 | 1 1 38.1 72 30 3 3 3 1 4 4 3 2 1 0 3 5 37 56 3 1 1 48 | 1 1 37.00 44 12 3 1 1 2 1 1 1 0 0 0 4 2 40.00 6.70 3 8.00 1 49 | 1 1 38.6 48 20 3 1 1 1 4 3 1 0 0 0 3 0 37 75 0 0 1 50 | 1 1 0 82 72 3 1 4 1 2 3 3 0 3 0 4 4 53 65 3 2 0 51 | 1 9 38.20 78 60 4 4 6 0 3 3 3 0 0 0 1 0 59.00 5.80 3 3.10 0 52 | 2 1 37.8 60 16 1 1 3 1 2 3 2 1 2 0 3 0 41 73 0 0 0 53 | 1 1 38.7 34 30 2 0 3 1 2 3 0 0 0 0 0 0 33 69 0 2 0 54 | 1 1 0 36 12 1 1 1 1 1 2 1 1 1 0 1 5 44.00 0 0 0 1 55 | 2 1 38.30 44 60 0 0 1 1 0 0 0 0 0 0 0 0 6.40 36.00 0 0 1 56 | 2 1 37.40 54 18 3 0 1 1 3 4 3 2 2 0 4 5 30.00 7.10 2 0 1 57 | 1 1 0 0 0 4 3 0 2 2 4 1 0 0 0 0 0 54 76 3 2 1 58 | 1 1 36.6 48 16 3 1 3 1 4 1 1 1 1 0 0 0 27 56 0 0 0 59 | 1 1 38.5 90 0 1 1 3 1 3 3 3 2 3 2 4 5 47 79 0 0 1 60 | 1 1 0 75 12 1 1 4 1 5 3 3 0 3 5.80 0 0 58.00 8.50 1 0 1 61 | 2 1 38.20 42 0 3 1 1 1 1 1 2 2 1 0 3 2 35.00 5.90 2 0 1 62 | 1 9 38.20 78 60 4 4 6 0 3 3 3 0 0 0 1 0 59.00 5.80 3 3.10 0 63 | 2 1 38.60 60 30 1 1 3 1 4 2 2 1 1 0 0 0 40.00 6.00 1 0 1 64 | 2 1 37.80 42 40 1 1 1 1 1 3 1 0 0 0 3 3 36.00 6.20 0 0 1 65 | 1 1 38 60 12 1 1 2 1 2 1 1 1 1 0 1 4 44 65 3 2 0 66 | 2 1 38.00 42 12 3 0 3 1 1 1 1 0 0 0 0 1 37.00 5.80 0 0 1 67 | 2 1 37.60 88 36 3 1 1 1 3 3 2 1 3 1.50 0 0 44.00 6.00 0 0 0 -------------------------------------------------------------------------------- /NeuralNetwork_Project1/mnist_dataset/mnist_readme.txt: -------------------------------------------------------------------------------- 1 | These are small subsets of the MNIST data set, transformed into CSV, and made available for easy testing as your code develops. 2 | 3 | The full dataset in CSV format is available at: http://pjreddie.com/projects/mnist-in-csv/ 4 | -------------------------------------------------------------------------------- /NeuralNetwork_Project1/my_own_images/2828_my_own_2.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/NeuralNetwork_Project1/my_own_images/2828_my_own_2.png -------------------------------------------------------------------------------- /NeuralNetwork_Project1/my_own_images/2828_my_own_3.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/NeuralNetwork_Project1/my_own_images/2828_my_own_3.png -------------------------------------------------------------------------------- /NeuralNetwork_Project1/my_own_images/2828_my_own_4.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/NeuralNetwork_Project1/my_own_images/2828_my_own_4.png -------------------------------------------------------------------------------- /NeuralNetwork_Project1/my_own_images/2828_my_own_5.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/NeuralNetwork_Project1/my_own_images/2828_my_own_5.png -------------------------------------------------------------------------------- /NeuralNetwork_Project1/my_own_images/2828_my_own_6.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/NeuralNetwork_Project1/my_own_images/2828_my_own_6.png -------------------------------------------------------------------------------- /NeuralNetwork_Project1/my_own_images/2828_my_own_image.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/NeuralNetwork_Project1/my_own_images/2828_my_own_image.png -------------------------------------------------------------------------------- /NeuralNetwork_Project1/my_own_images/2828_my_own_noisy_6.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/NeuralNetwork_Project1/my_own_images/2828_my_own_noisy_6.png -------------------------------------------------------------------------------- /NeuralNetwork_Project1/my_own_images/readme.txt: -------------------------------------------------------------------------------- 1 | These files are PNG images of size 28 x 28 2 | 3 | The file name pattern is 2828_my_own_....N_.png where N is the actual label (eg 3) and the ... can be any short text 4 | -------------------------------------------------------------------------------- /PCA_Project1/PCA.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Mon Aug 6 21:22:29 2018 4 | 5 | @author: wzy 6 | """ 7 | import numpy as np 8 | import matplotlib.pyplot as plt 9 | 10 | """ 11 | 函数说明:解析文本数据 12 | 13 | Parameters: 14 | filename - 文件名 15 | delim - 每一行不同特征数据之间的分隔方式,默认是tab键‘\t’ 16 | 17 | Returns: 18 | j将float型数据值列表转化为矩阵返回 19 | 20 | Modify: 21 | 2018-08-07 22 | """ 23 | def loadDataSet(filename, delim='\t'): 24 | fr = open(filename) 25 | stringArr = [line.strip().split(delim) for line in fr.readlines()] 26 | datArr = [list(map(float, line)) for line in stringArr] 27 | return np.mat(datArr) 28 | 29 | 30 | """ 31 | 函数说明:PCA特征维度压缩函数 32 | 33 | Parameters: 34 | dataMat - 数据集数据 35 | topNfeat - 需要保留的特征维度,即要压缩成的维度数,默认4096 36 | 37 | Returns: 38 | lowDDataMat - 压缩后的数据矩阵 39 | reconMat - 压缩后的数据矩阵反构出原始数据矩阵 40 | 41 | Modify: 42 | 2018-08-07 43 | """ 44 | def pca(dataMat, topNfeat=4096): 45 | # 求矩阵每一列的均值 46 | meanVals = np.mean(dataMat, axis=0) 47 | # 数据矩阵每一列特征减去该列特征均值 48 | meanRemoved = dataMat - meanVals 49 | # 计算协方差矩阵,处以n-1是为了得到协方差的无偏估计 50 | # cov(x, 0) = cov(x)除数是n-1(n为样本个数) 51 | # cov(x, 1)除数是n 52 | covMat = np.cov(meanRemoved, rowvar=0) 53 | # 计算协方差矩阵的特征值及对应的特征向量 54 | # 均保存在相应的矩阵中 55 | eigVals, eigVects = np.linalg.eig(np.mat(covMat)) 56 | # sort():对特征值矩阵排序(由小到大) 57 | # argsort():对特征矩阵进行由小到大排序,返回对应排序后的索引 58 | eigValInd = np.argsort(eigVals) 59 | # 从排序后的矩阵最后一个开始自下而上选取最大的N个特征值,返回其对应的索引 60 | eigValInd = eigValInd[: -(topNfeat+1): -1] 61 | # 将特征值最大的N个特征值对应索引的特征向量提取出来,组成压缩矩阵 62 | redEigVects = eigVects[:, eigValInd] 63 | # 将去除均值后的矩阵*压缩矩阵,转换到新的空间,使维度降低为N 64 | lowDDataMat = meanRemoved * redEigVects 65 | # 利用降维后的矩阵反构出原数据矩阵(用作测试,可跟未压缩的原矩阵比对) 66 | # 此处用转置和逆的结果一样redEigVects.I 67 | reconMat = (lowDDataMat * redEigVects.T) + meanVals 68 | print(reconMat) 69 | # 返回压缩后的数据矩阵及该矩阵反构出原始数据矩阵 70 | return lowDDataMat, reconMat 71 | 72 | 73 | if __name__ == '__main__': 74 | dataMat = loadDataSet('testSet.txt') 75 | lowDmat, reconMat = pca(dataMat, 1) 76 | print(np.shape(lowDmat)) 77 | fig = plt.figure() 78 | ax = fig.add_subplot(111) 79 | ax.scatter(dataMat[:, 0].flatten().A[0], dataMat[:, 1].flatten().A[0], marker='^', s=90) 80 | ax.scatter(reconMat[:, 0].flatten().A[0], reconMat[:, 1].flatten().A[0], marker='o', s=90, c='red') 81 | -------------------------------------------------------------------------------- /PCA_Project2/PCA.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Tue Aug 7 09:50:58 2018 4 | 5 | @author: wzy 6 | """ 7 | import numpy as np 8 | import matplotlib.pyplot as plt 9 | 10 | """ 11 | 函数说明:解析文本数据 12 | 13 | Parameters: 14 | filename - 文件名 15 | delim - 每一行不同特征数据之间的分隔方式,默认是tab键‘\t’ 16 | 17 | Returns: 18 | j将float型数据值列表转化为矩阵返回 19 | 20 | Modify: 21 | 2018-08-07 22 | """ 23 | def loadDataSet(filename, delim='\t'): 24 | fr = open(filename) 25 | stringArr = [line.strip().split(delim) for line in fr.readlines()] 26 | datArr = [list(map(float, line)) for line in stringArr] 27 | return np.mat(datArr) 28 | 29 | 30 | """ 31 | 函数说明:PCA特征维度压缩函数 32 | 33 | Parameters: 34 | dataMat - 数据集数据 35 | topNfeat - 需要保留的特征维度,即要压缩成的维度数,默认4096 36 | 37 | Returns: 38 | lowDDataMat - 压缩后的数据矩阵 39 | reconMat - 压缩后的数据矩阵反构出原始数据矩阵 40 | 41 | Modify: 42 | 2018-08-07 43 | """ 44 | def pca(dataMat, topNfeat=4096): 45 | # 求矩阵每一列的均值 46 | meanVals = np.mean(dataMat, axis=0) 47 | # 数据矩阵每一列特征减去该列特征均值 48 | meanRemoved = dataMat - meanVals 49 | # 计算协方差矩阵,处以n-1是为了得到协方差的无偏估计 50 | # cov(x, 0) = cov(x)除数是n-1(n为样本个数) 51 | # cov(x, 1)除数是n 52 | covMat = np.cov(meanRemoved, rowvar=0) 53 | # 计算协方差矩阵的特征值及对应的特征向量 54 | # 均保存在相应的矩阵中 55 | eigVals, eigVects = np.linalg.eig(np.mat(covMat)) 56 | # sort():对特征值矩阵排序(由小到大) 57 | # argsort():对特征矩阵进行由小到大排序,返回对应排序后的索引 58 | eigValInd = np.argsort(eigVals) 59 | # 从排序后的矩阵最后一个开始自下而上选取最大的N个特征值,返回其对应的索引 60 | eigValInd = eigValInd[: -(topNfeat+1): -1] 61 | # 将特征值最大的N个特征值对应索引的特征向量提取出来,组成压缩矩阵 62 | redEigVects = eigVects[:, eigValInd] 63 | # 将去除均值后的矩阵*压缩矩阵,转换到新的空间,使维度降低为N 64 | lowDDataMat = meanRemoved * redEigVects 65 | # 利用降维后的矩阵反构出原数据矩阵(用作测试,可跟未压缩的原矩阵比对) 66 | # 此处用转置和逆的结果一样redEigVects.I 67 | reconMat = (lowDDataMat * redEigVects.T) + meanVals 68 | print(reconMat) 69 | # 返回压缩后的数据矩阵及该矩阵反构出原始数据矩阵 70 | return lowDDataMat, reconMat 71 | 72 | 73 | """ 74 | 函数说明:缺失值处理函数 75 | 76 | Parameters: 77 | None 78 | 79 | Returns: 80 | datMat - 处理后的数据集 81 | 82 | Modify: 83 | 2018-08-07 84 | """ 85 | def replaceNaNWithMean(): 86 | # 解析数据 87 | datMat = loadDataSet('secom.data', ' ') 88 | # 获取特征维度 89 | numFeat = np.shape(datMat)[1] 90 | for i in range(numFeat): 91 | # 利用该维度所有非NaN特征求取均值 92 | meanVal = np.mean(datMat[np.nonzero(~np.isnan(datMat[:, 1].A))[0], i]) 93 | # 若均值也是NaN则用0代替 94 | if (np.isnan(meanVal)): 95 | meanVal = 0 96 | # 将该维度中所有NaN特征全部用均值替换 97 | datMat[np.nonzero(np.isnan(datMat[:, i].A))[0], i] = meanVal 98 | return datMat 99 | 100 | 101 | if __name__ == '__main__': 102 | dataMat = replaceNaNWithMean() 103 | # lowDmat, reconMat = pca(dataMat, topNfeat=20) 104 | fig = plt.figure() 105 | ax = fig.add_subplot(111) 106 | # ax.scatter(reconMat[:, 0].flatten().A[0], reconMat[:, 1].flatten().A[0], marker='o', s=90, c='red') 107 | meanVals = np.mean(dataMat, axis=0) 108 | meanRemoved = dataMat - meanVals 109 | covMat = np.cov(meanRemoved, rowvar=0) 110 | eigVals, eigVects = np.linalg.eig(np.mat(covMat)) 111 | # 特征数 112 | i = 6 113 | ax.scatter(range(i), eigVals[:i], marker='^', s=50, c='red') 114 | ax.plot(range(i), eigVals[:i]) 115 | lowDmat, reconMat = pca(dataMat, topNfeat=i) 116 | # 提取的6个特征 117 | print(lowDmat) -------------------------------------------------------------------------------- /Perceptron_Project1/DataSet.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/Perceptron_Project1/DataSet.png -------------------------------------------------------------------------------- /Perceptron_Project1/决策区域图像.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/Perceptron_Project1/决策区域图像.png -------------------------------------------------------------------------------- /Perceptron_Project1/每次迭代错误分类数量.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/Perceptron_Project1/每次迭代错误分类数量.png -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | # Machine-Learning-in-Action-Python3 2 | 本人是西安电子科技大学的一名研二在读学生,在学习机器学习的过程中拜读了王斌老师翻译的《机器学习实战》一书,书中对算法的原理以及编程实现进行了详细的介绍。 3 | 4 | 机器学习实战一书中的代码是基于python2的,故对书中的代码重新做了整理,全部代码可在**python3**环境下运行。 5 | 6 | 所有源程序中,文件夹名称的命名规则为:**算法名称+对应书中的第几个案例**,少数几个案例因为数据量比较大所以采用压缩包上传。 7 | 8 | 如果代码有任何问题欢迎与我联系,联系方式:807698462@qq.com 9 | 10 | ## 版本更新记录 11 | * 2019/2/9 在kNN_Project1文件夹下更新了鸢尾花多分类任务的sklearn包实现,文件命名为Chap_1.py 12 | * 2020/8/2 NeuralNetwork_Project1的代码是对《Python神经网络编程》这本书中代码的整理 13 | -------------------------------------------------------------------------------- /RidgeRegression_Project1/RidgeRegression.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Mon Jul 30 09:20:23 2018 4 | 5 | @author: wzy 6 | """ 7 | from matplotlib.font_manager import FontProperties 8 | import matplotlib.pyplot as plt 9 | import numpy as np 10 | 11 | """ 12 | 函数说明:加载数据 13 | 14 | Parameters: 15 | filename - 文件名 16 | 17 | Returns: 18 | xArr - x数据集 19 | yArr - y数据集 20 | 21 | Modify: 22 | 2018-07-30 23 | """ 24 | def loadDataSet(filename): 25 | # 计算特征个数,由于最后一列为y值所以减一 26 | numFeat = len(open(filename).readline().split('\t')) - 1 27 | xArr = [] 28 | yArr = [] 29 | fr = open(filename) 30 | for line in fr.readlines(): 31 | lineArr = [] 32 | curLine = line.strip().split('\t') 33 | for i in range(numFeat): 34 | lineArr.append(float(curLine[i])) 35 | xArr.append(lineArr) 36 | yArr.append(float(curLine[-1])) 37 | return xArr, yArr 38 | 39 | 40 | """ 41 | 函数说明:岭回归 42 | 43 | Parameters: 44 | xMat - x数据集 45 | yMat - y数据集 46 | lam - 缩减系数 47 | 48 | Returns: 49 | ws - 回归系数 50 | 51 | Modify: 52 | 2018-07-30 53 | """ 54 | def ridgeRegres(xMat, yMat, lam=0.2): 55 | xTx = xMat.T * xMat 56 | demon = xTx + np.eye(np.shape(xMat)[1]) * lam 57 | # 求矩阵的行列式 58 | if np.linalg.det(demon) == 0.0: 59 | print("矩阵为奇异矩阵,不能求逆") 60 | return 61 | # .I求逆矩阵 62 | ws = (demon.I) * (xMat.T) * yMat 63 | return ws 64 | 65 | 66 | """ 67 | 函数说明:岭回归测试 68 | 69 | Parameters: 70 | xArr - x数据集 71 | yArr - y数据集 72 | 73 | Returns: 74 | wMat - 回归系数矩阵 75 | 76 | Modify: 77 | 2018-07-30 78 | """ 79 | def ridgeTest(xArr, yArr): 80 | xMat = np.mat(xArr) 81 | yMat = np.mat(yArr).T 82 | # 数据标准化 83 | # 行与行操作,求均值 84 | yMean = np.mean(yMat, axis=0) 85 | # 数据减去均值 86 | yMat = yMat - yMean 87 | # 行与行操作,求均值 88 | xMeans = np.mean(xMat, axis=0) 89 | # 行与行操作,求方差 90 | xVar = np.var(xMat, axis=0) 91 | # 数据减去均值除以方差实现标准化 92 | xMat = (xMat - xMeans) / xVar 93 | # 30个不同的lamda测试 94 | numTestPts = 30 95 | # 初始化回归系数矩阵 96 | wMat = np.zeros((numTestPts, np.shape(xMat)[1])) 97 | # 改变lamda计算回归系数 98 | for i in range(numTestPts): 99 | # lamda以e的指数变化,最初是一个非常小的数 100 | ws = ridgeRegres(xMat, yMat, np.exp(i - 10)) 101 | # 计算回归系数矩阵 102 | wMat[i, :] = ws.T 103 | return wMat 104 | 105 | 106 | """ 107 | 函数说明:绘制岭回归系数矩阵 108 | 109 | Parameters: 110 | None 111 | 112 | Returns: 113 | None 114 | Modify: 115 | 2018-07-30 116 | """ 117 | def plotwMat(): 118 | # 设置中文字体 119 | font = FontProperties(fname=r"C:\Windows\Fonts\simsun.ttc", size=14) 120 | abX, abY = loadDataSet('abalone.txt') 121 | redgeWeights = ridgeTest(abX, abY) 122 | fig = plt.figure() 123 | ax = fig.add_subplot(111) 124 | ax.plot(redgeWeights) 125 | ax_title_text = ax.set_title(u'log(lamda)与回归系数的关系', FontProperties=font) 126 | ax_xlabel_text = ax.set_xlabel(u'log(lamda)', FontProperties=font) 127 | ax_ylabel_text = ax.set_ylabel(u'回归系数', FontProperties=font) 128 | plt.setp(ax_title_text, size=20, weight='bold', color='red') 129 | plt.setp(ax_xlabel_text, size=20, weight='bold', color='black') 130 | plt.setp(ax_ylabel_text, size=20, weight='bold', color='black') 131 | plt.show() 132 | 133 | 134 | if __name__ == '__main__': 135 | plotwMat() 136 | -------------------------------------------------------------------------------- /RidgeRegression_Project3/RidgeRegression.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | """ 3 | Created on Mon Jul 30 17:11:07 2018 4 | 5 | @author: wzy 6 | """ 7 | from sklearn import linear_model 8 | from bs4 import BeautifulSoup 9 | 10 | """ 11 | 函数说明:从页面读取数据,生成retX和retY列表 12 | 13 | Parameters: 14 | retX - 数据X 15 | retY - 数据Y 16 | inFile - HTML文件 17 | yr - 年份 18 | numPce - 乐高部件数目 19 | origPrc - 原价 20 | 21 | Returns: 22 | None 23 | 24 | Modify: 25 | 2018-07-30 26 | """ 27 | def scrapePage(retX, retY, inFile, yr, numPce, origPrc): 28 | # 打开并读取HTML文件 29 | with open(inFile, encoding='utf-8') as f: 30 | html = f.read() 31 | soup = BeautifulSoup(html) 32 | i = 1 33 | # 根据HTML页面结构进行解析 34 | currentRow = soup.find_all('table', r='%d' % i) 35 | while(len(currentRow) != 0): 36 | currentRow = soup.find_all('table', r='%d' % i) 37 | title = currentRow[0].find_all('a')[1].text 38 | lwrTitle = title.lower() 39 | # 查找是否有全新标签 40 | if(lwrTitle.find('new') > -1) or (lwrTitle.find('nisb') > -1): 41 | newFlag = 1.0 42 | else: 43 | newFlag = 0.0 44 | # 查找是否已经标志出售,我们只收集已出售的数据 45 | soldUnicde = currentRow[0].find_all('td')[3].find_all('span') 46 | if len(soldUnicde) == 0: 47 | print("商品#%d没有出售" % i) 48 | else: 49 | # 解析页面获取当前价格 50 | soldPrice = currentRow[0].find_all('td')[4] 51 | priceStr = soldPrice.text 52 | priceStr = priceStr.replace('$', '') 53 | priceStr = priceStr.replace(',', '') 54 | if len(soldPrice) > 1: 55 | priceStr = priceStr.replace('Free shipping', '') 56 | sellingPrice = float(priceStr) 57 | # 去掉不完整的套装价格 58 | if sellingPrice > origPrc * 0.5: 59 | print('%d\t%d\t%d\t%f\t%f' % (yr, numPce, newFlag, origPrc, sellingPrice)) 60 | retX.append([yr, numPce, newFlag, origPrc]) 61 | retY.append(sellingPrice) 62 | i += 1 63 | currentRow = soup.find_all('table', r='%d' % i) 64 | 65 | 66 | """ 67 | 函数说明:依次读取六种乐高套装的数据,并生成数据矩阵 68 | 69 | Parameters: 70 | retX - 数据X 71 | retY - 数据Y 72 | 73 | Returns: 74 | None 75 | 76 | Modify: 77 | 2018-07-30 78 | """ 79 | def setDataCollect(retX, retY): 80 | # 2006年的乐高8288,部件数目800,原价49.99 81 | scrapePage(retX, retY, './lego/lego8288.html', 2006, 800, 49.99) 82 | scrapePage(retX, retY, './lego/lego10030.html', 2002, 3096, 269.99) 83 | scrapePage(retX, retY, './lego/lego10179.html', 2007, 5195, 499.99) 84 | scrapePage(retX, retY, './lego/lego10181.html', 2007, 3428, 199.99) 85 | scrapePage(retX, retY, './lego/lego10189.html', 2008, 5922, 299.99) 86 | scrapePage(retX, retY, './lego/lego10196.html', 2009, 3263, 249.99) 87 | 88 | 89 | """ 90 | 函数说明:使用sklearn 91 | 92 | Parameters: 93 | None 94 | 95 | Returns: 96 | None 97 | 98 | Modify: 99 | 2018-07-30 100 | """ 101 | def usesklearn(): 102 | reg = linear_model.Ridge(alpha=.5) 103 | lgX = [] 104 | lgY = [] 105 | setDataCollect(lgX, lgY) 106 | # fit(X, y):Fit Ridge regression model 107 | reg.fit(lgX, lgY) 108 | print("%f%+f*年份%+f*部件数量%+f*是否为全新%+f*原价" % (reg.intercept_, reg.coef_[0], reg.coef_[1], reg.coef_[2], reg.coef_[3])) 109 | 110 | 111 | if __name__ == '__main__': 112 | usesklearn() 113 | -------------------------------------------------------------------------------- /RidgeRegression_Project3/cookbook_log.py: -------------------------------------------------------------------------------- 1 | # IPython log file 2 | 3 | runfile('C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project2/LinearRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project2') 4 | runfile('C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project3/LinearRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project3') 5 | runfile('C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project3/LinearRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project3') 6 | runfile('C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project1/RidgeRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project1') 7 | debugfile('C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project1/RidgeRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project1') 8 | runfile('C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project1/RidgeRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project1') 9 | runfile('C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project2/RidgeRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project2') 10 | debugfile('C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project2/RidgeRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project2') 11 | debugfile('C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project2/RidgeRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project2') 12 | debugfile('C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project2/RidgeRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project2') 13 | runfile('C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project4/LinearRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project4') 14 | runfile('C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project4/LinearRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project4') 15 | runfile('C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project4/LinearRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project4') 16 | runfile('C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project4/LinearRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project4') 17 | runfile('C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project4/LinearRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project4') 18 | runfile('C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project4/LinearRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/LinearRegression_Project4') 19 | runfile('C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project3/RidgeRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project3') 20 | runfile('C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project3/RidgeRegression.py', wdir='C:/Users/wzy/Desktop/MachineLearning/RidgeRegression_Project3') 21 | get_ipython().run_line_magic('logstart', 'cookbook_log.py rotate') 22 | get_ipython().run_line_magic('logoff', '') 23 | -------------------------------------------------------------------------------- /SVD_Project2/0_5.txt: -------------------------------------------------------------------------------- 1 | 00000000000000110000000000000000 2 | 00000000000011111100000000000000 3 | 00000000000111111110000000000000 4 | 00000000001111111111000000000000 5 | 00000000111111111111100000000000 6 | 00000001111111111111110000000000 7 | 00000000111111111111111000000000 8 | 00000000111111100001111100000000 9 | 00000001111111000001111100000000 10 | 00000011111100000000111100000000 11 | 00000011111100000000111110000000 12 | 00000011111100000000011110000000 13 | 00000011111100000000011110000000 14 | 00000001111110000000001111000000 15 | 00000011111110000000001111000000 16 | 00000011111100000000001111000000 17 | 00000001111100000000001111000000 18 | 00000011111100000000001111000000 19 | 00000001111100000000001111000000 20 | 00000001111100000000011111000000 21 | 00000000111110000000001111100000 22 | 00000000111110000000001111100000 23 | 00000000111110000000001111100000 24 | 00000000111110000000011111000000 25 | 00000000111110000000111111000000 26 | 00000000111111000001111110000000 27 | 00000000011111111111111110000000 28 | 00000000001111111111111110000000 29 | 00000000001111111111111110000000 30 | 00000000000111111111111000000000 31 | 00000000000011111111110000000000 32 | 00000000000000111111000000000000 33 | -------------------------------------------------------------------------------- /SVM_Project1/Figure_1.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/SVM_Project1/Figure_1.png -------------------------------------------------------------------------------- /SVM_Project1/testSet.txt: -------------------------------------------------------------------------------- 1 | 3.542485 1.977398 -1 2 | 3.018896 2.556416 -1 3 | 7.551510 -1.580030 1 4 | 2.114999 -0.004466 -1 5 | 8.127113 1.274372 1 6 | 7.108772 -0.986906 1 7 | 8.610639 2.046708 1 8 | 2.326297 0.265213 -1 9 | 3.634009 1.730537 -1 10 | 0.341367 -0.894998 -1 11 | 3.125951 0.293251 -1 12 | 2.123252 -0.783563 -1 13 | 0.887835 -2.797792 -1 14 | 7.139979 -2.329896 1 15 | 1.696414 -1.212496 -1 16 | 8.117032 0.623493 1 17 | 8.497162 -0.266649 1 18 | 4.658191 3.507396 -1 19 | 8.197181 1.545132 1 20 | 1.208047 0.213100 -1 21 | 1.928486 -0.321870 -1 22 | 2.175808 -0.014527 -1 23 | 7.886608 0.461755 1 24 | 3.223038 -0.552392 -1 25 | 3.628502 2.190585 -1 26 | 7.407860 -0.121961 1 27 | 7.286357 0.251077 1 28 | 2.301095 -0.533988 -1 29 | -0.232542 -0.547690 -1 30 | 3.457096 -0.082216 -1 31 | 3.023938 -0.057392 -1 32 | 8.015003 0.885325 1 33 | 8.991748 0.923154 1 34 | 7.916831 -1.781735 1 35 | 7.616862 -0.217958 1 36 | 2.450939 0.744967 -1 37 | 7.270337 -2.507834 1 38 | 1.749721 -0.961902 -1 39 | 1.803111 -0.176349 -1 40 | 8.804461 3.044301 1 41 | 1.231257 -0.568573 -1 42 | 2.074915 1.410550 -1 43 | -0.743036 -1.736103 -1 44 | 3.536555 3.964960 -1 45 | 8.410143 0.025606 1 46 | 7.382988 -0.478764 1 47 | 6.960661 -0.245353 1 48 | 8.234460 0.701868 1 49 | 8.168618 -0.903835 1 50 | 1.534187 -0.622492 -1 51 | 9.229518 2.066088 1 52 | 7.886242 0.191813 1 53 | 2.893743 -1.643468 -1 54 | 1.870457 -1.040420 -1 55 | 5.286862 -2.358286 1 56 | 6.080573 0.418886 1 57 | 2.544314 1.714165 -1 58 | 6.016004 -3.753712 1 59 | 0.926310 -0.564359 -1 60 | 0.870296 -0.109952 -1 61 | 2.369345 1.375695 -1 62 | 1.363782 -0.254082 -1 63 | 7.279460 -0.189572 1 64 | 1.896005 0.515080 -1 65 | 8.102154 -0.603875 1 66 | 2.529893 0.662657 -1 67 | 1.963874 -0.365233 -1 68 | 8.132048 0.785914 1 69 | 8.245938 0.372366 1 70 | 6.543888 0.433164 1 71 | -0.236713 -5.766721 -1 72 | 8.112593 0.295839 1 73 | 9.803425 1.495167 1 74 | 1.497407 -0.552916 -1 75 | 1.336267 -1.632889 -1 76 | 9.205805 -0.586480 1 77 | 1.966279 -1.840439 -1 78 | 8.398012 1.584918 1 79 | 7.239953 -1.764292 1 80 | 7.556201 0.241185 1 81 | 9.015509 0.345019 1 82 | 8.266085 -0.230977 1 83 | 8.545620 2.788799 1 84 | 9.295969 1.346332 1 85 | 2.404234 0.570278 -1 86 | 2.037772 0.021919 -1 87 | 1.727631 -0.453143 -1 88 | 1.979395 -0.050773 -1 89 | 8.092288 -1.372433 1 90 | 1.667645 0.239204 -1 91 | 9.854303 1.365116 1 92 | 7.921057 -1.327587 1 93 | 8.500757 1.492372 1 94 | 1.339746 -0.291183 -1 95 | 3.107511 0.758367 -1 96 | 2.609525 0.902979 -1 97 | 3.263585 1.367898 -1 98 | 2.912122 -0.202359 -1 99 | 1.731786 0.589096 -1 100 | 2.387003 1.573131 -1 101 | -------------------------------------------------------------------------------- /SVM_Project2/Figure_2.png: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/SVM_Project2/Figure_2.png -------------------------------------------------------------------------------- /SVM_Project2/testSet.txt: -------------------------------------------------------------------------------- 1 | 3.542485 1.977398 -1 2 | 3.018896 2.556416 -1 3 | 7.551510 -1.580030 1 4 | 2.114999 -0.004466 -1 5 | 8.127113 1.274372 1 6 | 7.108772 -0.986906 1 7 | 8.610639 2.046708 1 8 | 2.326297 0.265213 -1 9 | 3.634009 1.730537 -1 10 | 0.341367 -0.894998 -1 11 | 3.125951 0.293251 -1 12 | 2.123252 -0.783563 -1 13 | 0.887835 -2.797792 -1 14 | 7.139979 -2.329896 1 15 | 1.696414 -1.212496 -1 16 | 8.117032 0.623493 1 17 | 8.497162 -0.266649 1 18 | 4.658191 3.507396 -1 19 | 8.197181 1.545132 1 20 | 1.208047 0.213100 -1 21 | 1.928486 -0.321870 -1 22 | 2.175808 -0.014527 -1 23 | 7.886608 0.461755 1 24 | 3.223038 -0.552392 -1 25 | 3.628502 2.190585 -1 26 | 7.407860 -0.121961 1 27 | 7.286357 0.251077 1 28 | 2.301095 -0.533988 -1 29 | -0.232542 -0.547690 -1 30 | 3.457096 -0.082216 -1 31 | 3.023938 -0.057392 -1 32 | 8.015003 0.885325 1 33 | 8.991748 0.923154 1 34 | 7.916831 -1.781735 1 35 | 7.616862 -0.217958 1 36 | 2.450939 0.744967 -1 37 | 7.270337 -2.507834 1 38 | 1.749721 -0.961902 -1 39 | 1.803111 -0.176349 -1 40 | 8.804461 3.044301 1 41 | 1.231257 -0.568573 -1 42 | 2.074915 1.410550 -1 43 | -0.743036 -1.736103 -1 44 | 3.536555 3.964960 -1 45 | 8.410143 0.025606 1 46 | 7.382988 -0.478764 1 47 | 6.960661 -0.245353 1 48 | 8.234460 0.701868 1 49 | 8.168618 -0.903835 1 50 | 1.534187 -0.622492 -1 51 | 9.229518 2.066088 1 52 | 7.886242 0.191813 1 53 | 2.893743 -1.643468 -1 54 | 1.870457 -1.040420 -1 55 | 5.286862 -2.358286 1 56 | 6.080573 0.418886 1 57 | 2.544314 1.714165 -1 58 | 6.016004 -3.753712 1 59 | 0.926310 -0.564359 -1 60 | 0.870296 -0.109952 -1 61 | 2.369345 1.375695 -1 62 | 1.363782 -0.254082 -1 63 | 7.279460 -0.189572 1 64 | 1.896005 0.515080 -1 65 | 8.102154 -0.603875 1 66 | 2.529893 0.662657 -1 67 | 1.963874 -0.365233 -1 68 | 8.132048 0.785914 1 69 | 8.245938 0.372366 1 70 | 6.543888 0.433164 1 71 | -0.236713 -5.766721 -1 72 | 8.112593 0.295839 1 73 | 9.803425 1.495167 1 74 | 1.497407 -0.552916 -1 75 | 1.336267 -1.632889 -1 76 | 9.205805 -0.586480 1 77 | 1.966279 -1.840439 -1 78 | 8.398012 1.584918 1 79 | 7.239953 -1.764292 1 80 | 7.556201 0.241185 1 81 | 9.015509 0.345019 1 82 | 8.266085 -0.230977 1 83 | 8.545620 2.788799 1 84 | 9.295969 1.346332 1 85 | 2.404234 0.570278 -1 86 | 2.037772 0.021919 -1 87 | 1.727631 -0.453143 -1 88 | 1.979395 -0.050773 -1 89 | 8.092288 -1.372433 1 90 | 1.667645 0.239204 -1 91 | 9.854303 1.365116 1 92 | 7.921057 -1.327587 1 93 | 8.500757 1.492372 1 94 | 1.339746 -0.291183 -1 95 | 3.107511 0.758367 -1 96 | 2.609525 0.902979 -1 97 | 3.263585 1.367898 -1 98 | 2.912122 -0.202359 -1 99 | 1.731786 0.589096 -1 100 | 2.387003 1.573131 -1 101 | -------------------------------------------------------------------------------- /SVM_Project3/testSetRBF.txt: -------------------------------------------------------------------------------- 1 | -0.214824 0.662756 -1.000000 2 | -0.061569 -0.091875 1.000000 3 | 0.406933 0.648055 -1.000000 4 | 0.223650 0.130142 1.000000 5 | 0.231317 0.766906 -1.000000 6 | -0.748800 -0.531637 -1.000000 7 | -0.557789 0.375797 -1.000000 8 | 0.207123 -0.019463 1.000000 9 | 0.286462 0.719470 -1.000000 10 | 0.195300 -0.179039 1.000000 11 | -0.152696 -0.153030 1.000000 12 | 0.384471 0.653336 -1.000000 13 | -0.117280 -0.153217 1.000000 14 | -0.238076 0.000583 1.000000 15 | -0.413576 0.145681 1.000000 16 | 0.490767 -0.680029 -1.000000 17 | 0.199894 -0.199381 1.000000 18 | -0.356048 0.537960 -1.000000 19 | -0.392868 -0.125261 1.000000 20 | 0.353588 -0.070617 1.000000 21 | 0.020984 0.925720 -1.000000 22 | -0.475167 -0.346247 -1.000000 23 | 0.074952 0.042783 1.000000 24 | 0.394164 -0.058217 1.000000 25 | 0.663418 0.436525 -1.000000 26 | 0.402158 0.577744 -1.000000 27 | -0.449349 -0.038074 1.000000 28 | 0.619080 -0.088188 -1.000000 29 | 0.268066 -0.071621 1.000000 30 | -0.015165 0.359326 1.000000 31 | 0.539368 -0.374972 -1.000000 32 | -0.319153 0.629673 -1.000000 33 | 0.694424 0.641180 -1.000000 34 | 0.079522 0.193198 1.000000 35 | 0.253289 -0.285861 1.000000 36 | -0.035558 -0.010086 1.000000 37 | -0.403483 0.474466 -1.000000 38 | -0.034312 0.995685 -1.000000 39 | -0.590657 0.438051 -1.000000 40 | -0.098871 -0.023953 1.000000 41 | -0.250001 0.141621 1.000000 42 | -0.012998 0.525985 -1.000000 43 | 0.153738 0.491531 -1.000000 44 | 0.388215 -0.656567 -1.000000 45 | 0.049008 0.013499 1.000000 46 | 0.068286 0.392741 1.000000 47 | 0.747800 -0.066630 -1.000000 48 | 0.004621 -0.042932 1.000000 49 | -0.701600 0.190983 -1.000000 50 | 0.055413 -0.024380 1.000000 51 | 0.035398 -0.333682 1.000000 52 | 0.211795 0.024689 1.000000 53 | -0.045677 0.172907 1.000000 54 | 0.595222 0.209570 -1.000000 55 | 0.229465 0.250409 1.000000 56 | -0.089293 0.068198 1.000000 57 | 0.384300 -0.176570 1.000000 58 | 0.834912 -0.110321 -1.000000 59 | -0.307768 0.503038 -1.000000 60 | -0.777063 -0.348066 -1.000000 61 | 0.017390 0.152441 1.000000 62 | -0.293382 -0.139778 1.000000 63 | -0.203272 0.286855 1.000000 64 | 0.957812 -0.152444 -1.000000 65 | 0.004609 -0.070617 1.000000 66 | -0.755431 0.096711 -1.000000 67 | -0.526487 0.547282 -1.000000 68 | -0.246873 0.833713 -1.000000 69 | 0.185639 -0.066162 1.000000 70 | 0.851934 0.456603 -1.000000 71 | -0.827912 0.117122 -1.000000 72 | 0.233512 -0.106274 1.000000 73 | 0.583671 -0.709033 -1.000000 74 | -0.487023 0.625140 -1.000000 75 | -0.448939 0.176725 1.000000 76 | 0.155907 -0.166371 1.000000 77 | 0.334204 0.381237 -1.000000 78 | 0.081536 -0.106212 1.000000 79 | 0.227222 0.527437 -1.000000 80 | 0.759290 0.330720 -1.000000 81 | 0.204177 -0.023516 1.000000 82 | 0.577939 0.403784 -1.000000 83 | -0.568534 0.442948 -1.000000 84 | -0.011520 0.021165 1.000000 85 | 0.875720 0.422476 -1.000000 86 | 0.297885 -0.632874 -1.000000 87 | -0.015821 0.031226 1.000000 88 | 0.541359 -0.205969 -1.000000 89 | -0.689946 -0.508674 -1.000000 90 | -0.343049 0.841653 -1.000000 91 | 0.523902 -0.436156 -1.000000 92 | 0.249281 -0.711840 -1.000000 93 | 0.193449 0.574598 -1.000000 94 | -0.257542 -0.753885 -1.000000 95 | -0.021605 0.158080 1.000000 96 | 0.601559 -0.727041 -1.000000 97 | -0.791603 0.095651 -1.000000 98 | -0.908298 -0.053376 -1.000000 99 | 0.122020 0.850966 -1.000000 100 | -0.725568 -0.292022 -1.000000 101 | -------------------------------------------------------------------------------- /SVM_Project3/testSetRBF2.txt: -------------------------------------------------------------------------------- 1 | 0.676771 -0.486687 -1.000000 2 | 0.008473 0.186070 1.000000 3 | -0.727789 0.594062 -1.000000 4 | 0.112367 0.287852 1.000000 5 | 0.383633 -0.038068 1.000000 6 | -0.927138 -0.032633 -1.000000 7 | -0.842803 -0.423115 -1.000000 8 | -0.003677 -0.367338 1.000000 9 | 0.443211 -0.698469 -1.000000 10 | -0.473835 0.005233 1.000000 11 | 0.616741 0.590841 -1.000000 12 | 0.557463 -0.373461 -1.000000 13 | -0.498535 -0.223231 -1.000000 14 | -0.246744 0.276413 1.000000 15 | -0.761980 -0.244188 -1.000000 16 | 0.641594 -0.479861 -1.000000 17 | -0.659140 0.529830 -1.000000 18 | -0.054873 -0.238900 1.000000 19 | -0.089644 -0.244683 1.000000 20 | -0.431576 -0.481538 -1.000000 21 | -0.099535 0.728679 -1.000000 22 | -0.188428 0.156443 1.000000 23 | 0.267051 0.318101 1.000000 24 | 0.222114 -0.528887 -1.000000 25 | 0.030369 0.113317 1.000000 26 | 0.392321 0.026089 1.000000 27 | 0.298871 -0.915427 -1.000000 28 | -0.034581 -0.133887 1.000000 29 | 0.405956 0.206980 1.000000 30 | 0.144902 -0.605762 -1.000000 31 | 0.274362 -0.401338 1.000000 32 | 0.397998 -0.780144 -1.000000 33 | 0.037863 0.155137 1.000000 34 | -0.010363 -0.004170 1.000000 35 | 0.506519 0.486619 -1.000000 36 | 0.000082 -0.020625 1.000000 37 | 0.057761 -0.155140 1.000000 38 | 0.027748 -0.553763 -1.000000 39 | -0.413363 -0.746830 -1.000000 40 | 0.081500 -0.014264 1.000000 41 | 0.047137 -0.491271 1.000000 42 | -0.267459 0.024770 1.000000 43 | -0.148288 -0.532471 -1.000000 44 | -0.225559 -0.201622 1.000000 45 | 0.772360 -0.518986 -1.000000 46 | -0.440670 0.688739 -1.000000 47 | 0.329064 -0.095349 1.000000 48 | 0.970170 -0.010671 -1.000000 49 | -0.689447 -0.318722 -1.000000 50 | -0.465493 -0.227468 -1.000000 51 | -0.049370 0.405711 1.000000 52 | -0.166117 0.274807 1.000000 53 | 0.054483 0.012643 1.000000 54 | 0.021389 0.076125 1.000000 55 | -0.104404 -0.914042 -1.000000 56 | 0.294487 0.440886 -1.000000 57 | 0.107915 -0.493703 -1.000000 58 | 0.076311 0.438860 1.000000 59 | 0.370593 -0.728737 -1.000000 60 | 0.409890 0.306851 -1.000000 61 | 0.285445 0.474399 -1.000000 62 | -0.870134 -0.161685 -1.000000 63 | -0.654144 -0.675129 -1.000000 64 | 0.285278 -0.767310 -1.000000 65 | 0.049548 -0.000907 1.000000 66 | 0.030014 -0.093265 1.000000 67 | -0.128859 0.278865 1.000000 68 | 0.307463 0.085667 1.000000 69 | 0.023440 0.298638 1.000000 70 | 0.053920 0.235344 1.000000 71 | 0.059675 0.533339 -1.000000 72 | 0.817125 0.016536 -1.000000 73 | -0.108771 0.477254 1.000000 74 | -0.118106 0.017284 1.000000 75 | 0.288339 0.195457 1.000000 76 | 0.567309 -0.200203 -1.000000 77 | -0.202446 0.409387 1.000000 78 | -0.330769 -0.240797 1.000000 79 | -0.422377 0.480683 -1.000000 80 | -0.295269 0.326017 1.000000 81 | 0.261132 0.046478 1.000000 82 | -0.492244 -0.319998 -1.000000 83 | -0.384419 0.099170 1.000000 84 | 0.101882 -0.781145 -1.000000 85 | 0.234592 -0.383446 1.000000 86 | -0.020478 -0.901833 -1.000000 87 | 0.328449 0.186633 1.000000 88 | -0.150059 -0.409158 1.000000 89 | -0.155876 -0.843413 -1.000000 90 | -0.098134 -0.136786 1.000000 91 | 0.110575 -0.197205 1.000000 92 | 0.219021 0.054347 1.000000 93 | 0.030152 0.251682 1.000000 94 | 0.033447 -0.122824 1.000000 95 | -0.686225 -0.020779 -1.000000 96 | -0.911211 -0.262011 -1.000000 97 | 0.572557 0.377526 -1.000000 98 | -0.073647 -0.519163 -1.000000 99 | -0.281830 -0.797236 -1.000000 100 | -0.555263 0.126232 -1.000000 101 | -------------------------------------------------------------------------------- /SVM_Project4.zip: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/SVM_Project4.zip -------------------------------------------------------------------------------- /SVM_Project5.zip: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/SVM_Project5.zip -------------------------------------------------------------------------------- /kNN_Project1/Chap_1.py: -------------------------------------------------------------------------------- 1 | #!/usr/bin/env python 2 | # -*- coding:utf-8 -*- 3 | from sklearn.datasets import load_iris 4 | from sklearn.model_selection import train_test_split 5 | import pandas as pd 6 | import numpy as np 7 | from pandas.plotting import scatter_matrix 8 | import mglearn 9 | import matplotlib.pyplot as plt 10 | from sklearn.neighbors import KNeighborsClassifier 11 | iris_dataset = load_iris() 12 | X_train, X_test, y_train, y_test = train_test_split(iris_dataset['data'], iris_dataset['target'], random_state=0) 13 | iris_dataframe = pd.DataFrame(X_train, columns=iris_dataset.feature_names) 14 | # 利用DataFrame创建散点图矩阵,按照y_train着色 15 | grr = scatter_matrix(iris_dataframe, c=y_train, figsize=(15, 15), marker='o', 16 | hist_kwds={'bins': 20}, s=60, alpha=.8, cmap=mglearn.cm3) 17 | plt.show() 18 | knn = KNeighborsClassifier(n_neighbors=3) 19 | knn.fit(X_train, y_train) 20 | X_new = np.array([[5, 2.9, 1, 0.2]]) 21 | print("X_mew.shape: {}".format(X_new.shape)) 22 | prediction = knn.predict(X_new) 23 | print("Prediction: {}".format(prediction)) 24 | print("Predicted target name: {}".format(iris_dataset['target_names'][prediction])) 25 | # 模型评价 26 | print("Test set score: {:.2f}".format(knn.score(X_test, y_test))) 27 | -------------------------------------------------------------------------------- /kNN_Project2.zip: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wzy6642/Machine-Learning-in-Action-Python3/02a54b6b3ed77a0d1ccf418686df7d635af8e956/kNN_Project2.zip --------------------------------------------------------------------------------