| 
                         让我们使用Twitter情绪分析数据来计算每条推文的字数。我们将使用不同的方法,例如dataframe  iterrows方法,NumPy数组和apply方法。你可以从此处下载数据集(https://datahack.analyticsvidhya.com/contest/practice-problem-twitter-sentiment-analysis/?utm_source=blog&utm_medium=4-methods-optimize-python-code-data-science)。 
- ''' 
 - 优化方法:apply方法 
 - ''' 
 - # 导入库 
 - import pandas as pd  
 - import numpy as np 
 - import time 
 - import math 
 - data = pd.read_csv('train_E6oV3lV.csv') 
 - # 打印头部信息 
 - print(data.head()) 
 - # 使用dataframe iterows计算字符数 
 - print('nnUsing Iterrowsnn') 
 - start_time = time.time() 
 - data_1 = data.copy() 
 - n_words = [] 
 - for i, row in data_1.iterrows(): 
 -  n_words.append(len(row['tweet'].split())) 
 - data_1['n_words'] = n_words  
 - print(data_1[['id','n_words']].head()) 
 - end_time = time.time() 
 - print('nTime taken to calculate No. of Words by iterrows :', 
 - (end_time-start_time),'seconds') 
 - # 使用Numpy数组计算字符数 
 - print('nnUsing Numpy Arraysnn') 
 - start_time = time.time() 
 - data_2 = data.copy() 
 - n_words_2 = [] 
 - for row in data_2.values: 
 -  n_words_2.append(len(row[2].split())) 
 - data_2['n_words'] = n_words_2 
 - print(data_2[['id','n_words']].head()) 
 - end_time = time.time() 
 - print('nTime taken to calculate No. of Words by numpy array : ', 
 - (end_time-start_time),'seconds') 
 - # 使用apply方法计算字符数 
 - print('nnUsing Apply Methodnn') 
 - start_time = time.time() 
 - data_3 = data.copy() 
 - data_3['n_words'] = data_3['tweet'].apply(lambda x : len(x.split())) 
 - print(data_3[['id','n_words']].head()) 
 - end_time = time.time() 
 - print('nTime taken to calculate No. of Words by Apply Method : ', 
 - (end_time-start_time),'seconds') 
 
                          (编辑:我爱故事小小网_铜陵站长网) 
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! 
                     |