99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

分享10個(gè)Pandas在實(shí)際應(yīng)用中肯定會(huì)用到的技巧

數(shù)據(jù)分析與開發(fā) ? 來(lái)源:機(jī)器之心 ? 作者:機(jī)器之心 ? 2022-11-21 14:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


	

pandas是數(shù)據(jù)科學(xué)家必備的數(shù)據(jù)處理庫(kù),我們今天總結(jié)了10個(gè)在實(shí)際應(yīng)用中肯定會(huì)用到的技巧。

1、Select from table where f1=’a’ and f2=’b’

使用AND或OR選擇子集:

dfb=df.loc[(df.Week==week)&(df.Day==day)]
OR的話是這樣dfb=df.loc[(df.Week==week)|(df.Day==day)]

2、Select where in

從一個(gè)df中選擇一個(gè)包含在另外一個(gè)df的數(shù)據(jù),例如下面的sql

select*fromtable1wherefield1in(selectfield1fromtable2)

我們有一個(gè)名為“days”的df,它包含以下值。

3bcecdd4-6955-11ed-8abf-dac502259ad0.png

如果有第二個(gè)df:

3be44466-6955-11ed-8abf-dac502259ad0.png

可以直接用下面的方式獲取

days=[0,1,2]
df[df(days)]

3、Select where not in

就像IN一樣,我們肯定也要選擇NOT IN,這個(gè)可能是更加常用的一個(gè)需求,但是卻很少有文章提到,還是使用上面的數(shù)據(jù):

days=[0,1,2]
df[~df(days)]

使用~操作符就可以了

3bfd4f4c-6955-11ed-8abf-dac502259ad0.png

4、select sum(*) from table group by

分組統(tǒng)計(jì)和求和也是常見的操作,但是使用起來(lái)并不簡(jiǎn)單:

df(by=['RepID','Week','CallCycleDay']).sum()

如果想保存結(jié)果或稍后使用它們并引用這些字段,請(qǐng)?zhí)砑?as_index=False

df.groupby(by=['RepID','Week','CallCycleDay'],as_index=False).sum()

3c14cc94-6955-11ed-8abf-dac502259ad0.png

使用as_index= false,可以表的形式保存列

5、從一個(gè)表更另外一個(gè)表的字段

我們從一個(gè)df中更改了一些值,現(xiàn)在想要更新另外一個(gè)df,這個(gè)操作就很有用。

dfb=dfa[dfa.field1='somevalue'].copy()
dfb['field2']='somevalue'
dfa.update(dfb)

這里的更新是通過(guò)索引匹配的。

6、使用apply/lambda創(chuàng)建新字段

我們創(chuàng)建了一個(gè)名為address的新字段,它是幾個(gè)字段進(jìn)行拼接的。

dfa['address']=dfa.apply(lambdarow:row['StreetName']+','+
row['Suburb']+','+str(row['PostalCode']),axis=1)

7、插入新行

插入新數(shù)據(jù)的最佳方法是使用concat。我們可以用有pd. datafframe .from_records一將新行轉(zhuǎn)換為df。

newRow=row.copy()
newRow.CustomerID=str(newRow.CustomerID)+'-'+str(x)
newRow.duplicate=True
df=pd.concat([df,pd.DataFrame.from_records([newRow])])

8、更改列的類型

可以使用astype函數(shù)將其快速更改列的數(shù)據(jù)類型

df=pd.read_excel(customers_.xlsx')
df['Longitude']=df['Longitude'].astype(str)
df['Latitude']=df['Longitude'].astype(str)

9、刪除列

使用drop可以刪除列:

defcleanColumns(df):
forcolindf.columns:
ifcol[0:7]=="Unnamed":
df.drop(col,inplace=True,axis=1)
returndf

10、地圖上標(biāo)注點(diǎn)

這個(gè)可能是最沒用的技巧,但是他很好玩

這里我們有一些經(jīng)緯度的數(shù)據(jù):

3c37a2b4-6955-11ed-8abf-dac502259ad0.png

現(xiàn)在我們把它根據(jù)經(jīng)緯度在地圖上進(jìn)行標(biāo)注:

df_clustercentroids=pd.read_csv(centroidFile)
lst_elements=sorted(list(dfm.cluster2.unique()))
lst_colors=['#%06X'%np.random.randint(0,0xFFFFFF)foriinrange(len(lst_elements))]
dfm["color"]=dfm["cluster2"]
dfm["color"]=dfm["color"].apply(lambdax:lst_colors[lst_elements.index(x)])

m=folium.Map(location=[dfm.iloc[0].Latitude,dfm.iloc[0].Longitude],zoom_start=9)

forindex,rowindfm.iterrows():
folium.CircleMarker(location=[float(row['Latitude']),float(row['Longitude'])],radius=4,popup=str(row['RepID'])+'|'+str(row.CustomerID),color=row['color'],fill=True,fill_color=row['color']
).add_to(m)

forindex,rowindf_clustercentroids.iterrows():
folium.Marker(location=[float(row['Latitude']),float(row['Longitude'])],popup=str(index)+'|#='+str(dfm.loc[dfm.cluster2==index].groupby(['cluster2'])['CustomerID'].count().iloc[0]),icon=folium.Icon(color='black',icon_color=lst_colors[index]),tooltip=str(index)+'|#='+str(dfm.loc[dfm.cluster2==index].groupby(['cluster2'])['CustomerID'].count().iloc[0])).add_to(m)

m

結(jié)果如下:

3c62f5cc-6955-11ed-8abf-dac502259ad0.png

審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91925
  • SQL
    SQL
    +關(guān)注

    關(guān)注

    1

    文章

    783

    瀏覽量

    45174

原文標(biāo)題:分享 10 個(gè) Pandas 的小技巧!

文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【中科昊芯Core_DSC280025C開發(fā)板試用體驗(yàn)】+3.DSP基礎(chǔ)外設(shè)調(diào)試(含源碼)

    的文件。 至于中斷函數(shù)中,肯定會(huì)涉及到一些業(yè)務(wù)邏輯相關(guān)數(shù)據(jù)和功能函數(shù),所以,我增加了回調(diào)函數(shù)機(jī)制(這個(gè)是參考ST的Hal庫(kù)機(jī)制) 這樣的好處是,工程文件不會(huì)交叉調(diào)用,看起來(lái)沒有那么亂糟糟的。當(dāng)然,這只
    發(fā)表于 07-13 16:07

    工業(yè)物聯(lián)網(wǎng)網(wǎng)關(guān)會(huì)用到哪些電子模組

    工業(yè)物聯(lián)網(wǎng)網(wǎng)關(guān)通常會(huì)用到通信模組、主控模組、安全模組、接口擴(kuò)展模組和電源管理模組等,以下是具體介紹: 通信模組:用于實(shí)現(xiàn)網(wǎng)關(guān)與外部網(wǎng)絡(luò)或設(shè)備的通信連接。常見的有5G/4G模組,如華為MH5000、移
    的頭像 發(fā)表于 07-11 17:56 ?288次閱讀

    工業(yè)RTU會(huì)用到哪些芯片

    工業(yè)RTU(遠(yuǎn)程終端單元)通常會(huì)用到處理器芯片、通信芯片、數(shù)據(jù)采集芯片、存儲(chǔ)芯片和電源管理芯片等。
    的頭像 發(fā)表于 07-05 09:15 ?178次閱讀

    工業(yè)網(wǎng)關(guān)會(huì)用到哪些芯片

    工業(yè)網(wǎng)關(guān)通常會(huì)集成多種芯片以滿足其復(fù)雜的功能需求,具體可能會(huì)用到以下幾類芯片: 處理器芯片:這是工業(yè)網(wǎng)關(guān)的核心部件,負(fù)責(zé)執(zhí)行控制指令、數(shù)據(jù)處理以及運(yùn)行操作系統(tǒng)等任務(wù)。可能會(huì)采用高性能的ARM架構(gòu)
    的頭像 發(fā)表于 07-03 17:26 ?189次閱讀

    HTTP協(xié)議工業(yè)領(lǐng)域會(huì)用到

    HTTP協(xié)議工業(yè)領(lǐng)域會(huì)用到,并且工業(yè)互聯(lián)網(wǎng)、設(shè)備管理、數(shù)據(jù)交互等多個(gè)方面發(fā)揮著重要作用,以下為你詳細(xì)介紹: 工業(yè)互聯(lián)網(wǎng)場(chǎng)景 設(shè)備接入與管理 原理:工業(yè)互聯(lián)網(wǎng)平臺(tái)中,各類工業(yè)設(shè)備(
    的頭像 發(fā)表于 06-03 09:17 ?188次閱讀

    實(shí)際硬件設(shè)計(jì)中非常經(jīng)典巧妙的20個(gè)電路合集,帶分析,收藏起來(lái)慢慢看!

    1、防反接保護(hù)(二極管)實(shí)際電子設(shè)計(jì)中,防反接保護(hù)電路非常重要,不要覺得自己肯定不會(huì)接錯(cuò),實(shí)際上無(wú)論多么小心,還是會(huì)犯錯(cuò)誤......最簡(jiǎn)單的就是利用二極管了,利用二極管的單向?qū)щ娦?/div>
    發(fā)表于 03-24 13:49

    請(qǐng)問(wèn)DMD芯片可以用透明硅膠膠封不?

    DMD芯片是由精微反射鏡面組成的,這些鏡面肯定會(huì)有開合的,不知道這些鏡面的上層是否有玻璃等透明材質(zhì)做隔離,要是有的話,感覺理論上是可以用透明硅膠對(duì)DMD芯片做整體膠封的?
    發(fā)表于 02-26 06:03

    如何通過(guò)仿真準(zhǔn)確的預(yù)測(cè)信號(hào)完整性

    ,我們就可以計(jì)算得到信號(hào)的帶寬。一般來(lái)說(shuō)芯片廠家提供的仿真模型無(wú)論是IBIS還是Spice模型都是很信號(hào)帶寬相匹配的。比如說(shuō)一個(gè)器件的IBIS模型中肯定不會(huì)包含serdes信號(hào)的模型,如果器件中有serdes接口廠家肯定會(huì)提供S
    的頭像 發(fā)表于 01-22 11:51 ?1895次閱讀
    如何通過(guò)仿真準(zhǔn)確的預(yù)測(cè)信號(hào)完整性

    LabVIEW抽象消息使用教程(上)

    自學(xué)LabVIEW的Actor FrameWork的消息與抽象消息的時(shí)候肯定會(huì)覺得非常模糊。小編將給大家?guī)?lái)一個(gè)有關(guān)抽象消息的教程,分為上下兩期,本期將帶領(lǐng)大家創(chuàng)建Actor中的方法并為方法創(chuàng)建對(duì)應(yīng)的消息。
    的頭像 發(fā)表于 01-03 14:22 ?1248次閱讀
    LabVIEW抽象消息使用教程(上)

    淺析射頻無(wú)線遙控器定制的意義——射頻肯定會(huì)取代紅外

    定制再多的產(chǎn)品,也不會(huì)有重碼問(wèn)題。另一方面,各設(shè)備廠商之間可以達(dá)成配對(duì)協(xié)議,設(shè)計(jì)一個(gè)遙控器可以配對(duì)多臺(tái)設(shè)備的功能,這樣既可以節(jié)省資源浪費(fèi),也方便人們的換裝。
    的頭像 發(fā)表于 12-10 10:33 ?829次閱讀
    淺析射頻無(wú)線遙控器定制的意義——射頻<b class='flag-5'>肯定會(huì)</b>取代紅外

    ADS114S06 Demo代碼中找不到頭文件是怎么回事?

    ADS114S06提供的Demo軟件中沒有找到相應(yīng)的頭文件,搜索也是搜索不到相應(yīng)的頭文件的,一個(gè)個(gè)文件里面看也沒有找到。我準(zhǔn)備要移植到項(xiàng)目里面了,但是這些沒有頭文件,沒有定義的宏,肯定會(huì)報(bào)錯(cuò)的。能否幫忙提供一下支持。謝謝。
    發(fā)表于 11-28 06:41

    RAPIDS cuDF將pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當(dāng)前已能夠?yàn)?950 萬(wàn) pandas 用戶帶來(lái) GPU 加速,且無(wú)需修改代碼。
    的頭像 發(fā)表于 11-20 09:52 ?665次閱讀
    RAPIDS cuDF將<b class='flag-5'>pandas</b>提速近150倍

    使用TLV3501做了一個(gè)單限比較器,可以使用到10MHZ,但是實(shí)際使用時(shí)卻達(dá)不到,為什么?

    目前使用TLV3501做了一個(gè)單限比較器,比較閾值為1V,仿真正常,可以使用到10MHZ,但是實(shí)際使用時(shí)卻達(dá)不到,只能用1Mhz左右, 仿真圖如下: 請(qǐng)問(wèn)
    發(fā)表于 08-29 07:23

    功放芯片中說(shuō)的失真10%實(shí)際應(yīng)用中怎么衡量?

    功放芯片中說(shuō)的失真10%實(shí)際應(yīng)用中怎么衡量
    發(fā)表于 08-14 06:03

    OPA552很容易損壞是怎么回事?

    您好!板子上有16路OPA552做直流電源輸出電路,輸出電壓范圍-10V~+30V,V+=32V,V-=-15V,實(shí)際使用中沒有什么問(wèn)題,但是OPA552經(jīng)常會(huì)損壞,不是超過(guò)功率損壞,16路中
    發(fā)表于 08-01 06:31