導航:首頁 > 數據處理 > 怎麼選擇r包中的數據集代碼

怎麼選擇r包中的數據集代碼

發布時間:2022-11-26 22:13:57

① R語言內置mtcars數據集的小問題,求代碼

rownames(mtcars)[which(mtcars['qsec']==min(mtcars['qsec']))]
mtcars['disp'][mtcars['qsec']==min(mtcars['qsec'])]
mean(mtcars['mpg'][mtcars['cyl']==4])

② 如何用R語言在數據中提取指定列數據,並且形成一個新的數據表

最簡單的方法,數據框的名稱,加上你要提取的列數,示例如下:

需要注意的是,如果只提取單列的話,得到的數據就變成了一個vector,而不再是dataframe的格式了。

③ 如何使用R中內置的數據集

dim(data()$results )
data()$results [ ,4]
R 在 datasets 包提供了 100 個可以使用的數據集,這些數據集都可以通過 data() 函數載入入內存

④ R語言自學筆記-3設置路徑、R包操作

#設置默認路徑

#顯示當前工作目錄(軟體默認使用工作目錄)

getwd()

#修改默認工作目錄

setwd(dir = "e:/Rwork/")

#提示工作目錄

getwd()

#查看目錄下包含的文件

list.files()

#或者

dir()

#R包安裝

install.packages("vcd")

#顯示庫所在的位置

.libPaths()

#顯示庫里有哪些安裝包

library()

#載入包

library(vcd)

#or

require(vcd)

#直接輸入函數看某些函數來自於R的哪個包

#如何使用R包

help(package="vcd")

help(package="ggplot2")

#查看包的信息,列出R包的基礎內容,顯示內置的數據集的內容,給包中的函數作為案例來使用

library(help="vcd")

#還有一些包中的函數,是包的核心內容,擴展了R的功能

Arthritis

#列出包中所有包含的函數

ls("package:vcd")

#每個函數如何使用查看對應幫助文檔

#列出R包中包含的所有數據集

data(package="vcd")

#使用完一個包之後,將包從內存中移除

detach("package:vcd")

#再使用

Arthritis

#會出現報錯:需要重新再載入

#刪除已安裝的包

remove.packages("vcd")

#會將R包從硬碟上徹底刪除,無法繼續使用了,用得不多

#R包的批量移植(更換新設備)

#列出當前環境中已安裝的R包

installed.packages()

#取第一列,,,使用下標來訪問數據框的第一列

installed.packages()[,1]

#將所以R包名字保存到一個文件中

Rpack<- installed.packages()[,1]

save(Rpack,file = "Rpack.Rwork")

#將這個文件移到另一個設備上

#在另一個設備上使用load函數打開這個文件

#存到另外一個變數Rpack中

#看到這些R包

#Rpack

#批量安裝這些R包

#使用一個for循環

for(i in Rpack)install.packages(i)

#如何獲取R的幫助信息

help.start()

#查看某個函數的功能

help(sum)

#or

?plot

?sum

#快速了解函數參數而不想查閱詳細文檔

args(plot)

#查看函數使用案例

example(mean)

example("hist")

#列出R的一些案例圖

demo(graphics)

#查看R安裝的某個包的幫助文檔

help(package=ggplot2)

#有些R包包含vignette文檔,這中文檔包含更多內容,也更加規范,裡面有簡介、教程、開發文檔等

vignette()

#不是每個包都包含這種格式的文檔

vignette("xts")

#有時安裝了某包但使用help命令搜索不到相關函數,是因為沒有載入這個包

#需用使用library函數載入這個包

#載入之後才能使用help函數找到相關文檔

#或者直接在help命令中加上package選項  等於  要搜索R包的名字,這種方法比較麻煩

#??接要搜索函數名字,這種情況下不載入包也可以

#有些情況下,不知道具體的函數名,只能模糊搜索

#查找與繪制熱圖相關的幫助信息(使用這條命令進行本地搜索)

help.search(heatmap)

#提示搜索不到

#因為需要加上引號

help.search("heatmap")

#搜到stats包中的heatmap函數,可以用來繪制熱圖

#help.search("heatmap")也可以簡寫成下面一條命令

??heatmap#不需要加引號

#列出所有包含關鍵字的內容

apropos("sum")

#可以通過mod參數調整查詢的內容

apropos("sum",mod="function")#只列出函數

#help.search或??都是進行本地的文檔搜索

#有時搜索不到或者文檔太老了可以使用RSiteSearch()函數進行網路搜索

RSiteSearch(matlab)

#運行函數會使用默認瀏覽器來訪問R官網,在官網中進行搜索,列出更多的結果

#可以利用搜索引擎進行問題搜索

⑤ R語言之創建數據集

R語言之創建數據集
數據集通常是由數據構成的一個矩形數組,行表示觀測,列表示變數。
R中有許多用於存儲數據的結構,包括標量、向量、數組、數據框和列表。
在R中,對象(object)是指可以賦值給變數的任何事物,包括常量、數據結構、函數、甚至是圖形。因子(factor)是名義型變數或有序型變數,在R中被特殊地存儲和處理。
R中的數據結構:
1.1向量
向量是用於存儲數值型、字元型或邏輯型數據的一維數組。創建向量使用函數c(),如下例所示:
數值型向量:a<-c(1,2,5,3,6,-2,4)
字元型向量:b<-c("one","two","three")
邏輯型向量:c<-c(TRUE,TRUE,TRUE,FALSE,TRUE)
註:單個向量中的數據必須擁有相同的類型或模式。
標量是只含一個元素的向量,例如f<-3、g<-"US"和h<-TRUE。它們用於保存常量。
訪問向量中的元素,可在方括弧中給定元素所處位置的數值,如:a[c(2,4)]用於訪問向量a中的第二個和第四個元 素。
1.2矩陣
矩陣是一個二維數組,只是每個元素都擁有相同的模式(數值型、字元型或邏輯型),可以通過matrix創建矩陣
一般使用格式為:
mymatrix<-matrix(vector,nrow=number_of_rows,ncol=number_of_columns,byrow=logical_value,dimnames=list(
char_vector_rownames,char_vector_colnames)) ,其中vector包含了矩陣的元素,nrow和ncol用以指定
行和列的維數,dimnames包含了可選的以字元型向量表示的行名和列名。選項byrow則表明矩陣應當按行
填充(byrow=TRUE)還是按列填充(byrow=FALSE),默認情況下按列填充。代碼演示如下:
[plain] view plain
> cells<-c(1,23,56,485)
> rnames<-c("R1","R2")
> cnames<-c("c1","c2")

[plain] view plain

<pre name="code" class="html">> mymatrix<-matrix(cells ,nrow=2,ncol=2,byrow=TRUE,dimnames=list(rnames,cnames))
> mymatrix
c1 c2
R1 1 23
R2 56 485
1.3數組
數組與矩陣類似,但是維數可以大於2。數組可通過array函數創建,形式如下:
myarray<-array(vector,dimensions,dimnames),其中vector包含了數組中的數據,dimensions是一個數值型向量,給出了各個維度下標的最大值,而dimnames是可選的、各維度名稱標簽的列表。代碼如下:
[html] view plain

> dim<-c("A1","A2")
> dim1<-c("A1","A2")
> dim2<-c("B1","B2","B3")
> dim3<-c("C1","C2","C3","C4")
> z<-array(1:24,c(2,3,4),dimnames=list(dim1,dim2,dim3))
> z
, , C1

B1 B2 B3
A1 1 3 5
A2 2 4 6

, , C2

B1 B2 B3
A1 7 9 11
A2 8 10 12

, , C3

B1 B2 B3
A1 13 15 17
A2 14 16 18

, , C4

B1 B2 B3
A1 19 21 23
A2 20 22 24
1.4數據框
數據框中不同的列可以包含不同模式(數值型、字元型等)的數據,是R中最常處理的數據結構。數據框可以通過函數data.frame()創建:mydata<-data.frame(col1,col2,col3,...),其中的列向量col1,col2,col3,...可為任何類型(如字元型、數值型或邏輯型)。每一列的名稱可由函數names指定。代碼如下:
[html] view plain

> age<-c(25,34,28,53)
> patientID<-c(1,2,3,4)
> diabetes<-c("Type1","Type2","Type1","Type1")
> status<-c("Poor","Improved","Excellent","Poor")
> patientdata<-data.frame(patientID,age,diabetes,status)
> patientdata
patientID age diabetes status
1 1 25 Type1 Poor
2 2 34 Type2 Improved
3 3 28 Type1 Excellent
4 4 53 Type1 Poor
> patientdata$age
[1] 25 34 28 53
<pre name="code" class="html">> table(patientdata$diabetes,patientdata$status)

Excellent Improved Poor
Type1 1 0 2
Type2 0 1 0
$被用來選取一個給定數據框中的某個特定變數,上面table(patientdata$diabetes,patientdata$status)生成了 diabetes和status的列聯表。
函數attach()可將數據框添加到R的搜索路徑中。
函數detach()將數據框從搜素路徑中移除。
相對於attach。多數的R書籍更推薦使用函數with()。
1.5因子
變數可歸結為名義型、有序型或連續型變數。類別(名義型)變數和有序類別(有序型)變數在R中稱為因子。因子在R中非常重要,因為它決定了數據的分析方式以及如何進行視覺呈現。
函數factor()以一個整數向量的形式存儲類別值,整數的取值范圍是[1...k](其中k是名義變數中唯一值得個數),同時一個由字元串(原始值)組成的內部向量將映射到這些整數上。
名義型eg:假設有向量:diabetes<-c("Type1","Type2","Type1","Type1")
語句diabetes<-factor(diabetes)將此向量存儲為(1,2,1,1).
有序型eg: 對於給定變數status<-c("Poor","Improved","Excellent","Poor")
語句status<-factor(status,ordered=TRUE)會將向量編碼為(3,2,1,3)。
1.6列表(list)
列表是R的數據類型中最為復雜的一種。列表就是一些對象的(或成分,component)的有序集合。列表允許你整合若干(可能無關)的對象到單個對象名下。例如,某個列表中可能是若干向量、矩陣、數據框,甚至是其他列表的組合。可以使用函數list()創建列表:
mylist<-list(object1,object2,...)
註:列表成為了R中的重要數據結構。
1.列表允許以一種簡單的方式組織和重新調用不相乾的信息;
2.許多R函數的運行結果都是以列表的形式返回的。

⑥ R中選擇數據框的列

在本教程中,您將學習如何使用R函數select()和pull()[在dplyr包中]按名稱和位置選擇數據框的列。我們還將展示如何從數據框架中刪除列。

包含以下函數:

pull (): 以向量的形式提取列值. 可以通過名稱或索引指定感興趣的列。

select ():將一個或多個列提取為一個數據表。它還可以用於從數據框架中刪除列。

select_if (): 根據特定條件選擇列。例如,可以使用這個函數來選擇列(如果它們是數值型的)。

幫助函數  -  starts_with (),  ends_with (),  contains (),  matches (),  one_of (): Select columns/variables based on their names

需要的包

載入 tidyverse 包,該R包中包含 dplyr 包:

示例數據

我們將使用R內置的iris數據集,首先將其轉換為tibble數據框(tbl_df),以便於進行數據分析

以向量vector 的形式提取列值

將列提取為數據表

1)按位置選擇列

按名稱選擇列

有幾個特殊的函數可以在  select()  函數裡面使用   starts_with (),  ends_with (),  contains (),  matches (),  one_of (), 等.

基於一個條件選擇列

可以對列應用一個函數。選擇函數返回TRUE的列。

只選擇數值型的列:

刪除列

若要從數據框架中刪除列,請在其名稱前加上一個減號  - .

注意,如果希望按位置放置列,語法如下所示。

在本教程中,我們介紹如何根據位置和名稱選擇列。此外,我們還介紹了如何從數據框架中刪除列。

⑦ 怎麼才能查看R語言某個包某函數源碼

如果是程序包中自己帶的函數,可用以下操作:

  1. https://cran.r-project.org/

  2. 點擊左側Packages

  3. 點擊中間Table of available packages, sorted by date of publication鏈接,進入包的列表界面

  4. ctrl+F組合鍵在網頁中搜索你關心的R包,例如包WGCNA,點擊進入此R包主界面

  5. 點擊Downloads下面的Packagesource:
    WGCNA_1.51.tar.gz

  6. 解壓此包,然後找到裡面名字為R的文件夾,裡面都是R語言包中包含的R的函數的代碼

如果是在bioconctor中的包,可以在bioconctor官網中搜索此R包,進入此包界面,下載.tar.gz的這個文件,尋找方法如上.

⑧ r語言如何建立數據集

一般都是寫在Excel中,然後導入R語言。導入代碼如下:
install.packages('xslx')
library(xlsx)
Sys.setlocale("LC_ALL", "zh_cn.utf-8")
a=read.xlsx2('d:/1.xlsx',1,header=F)
head(a)顯示前六行
class(a$y)/str(a)查看列/全集數據類型
a$y=as.numeric(a$y)轉換數據類型

⑨ 【2020-05-31】如何查看並使用R的內置數據集

1、查看
R的內置數據集一共有兩種:R內部 datasets 包中的數據集以及安裝的其他 package 中包含的數據集,這些數據集的查看方法如下:

2、使用

閱讀全文

與怎麼選擇r包中的數據集代碼相關的資料

熱點內容
excel表格的數據如何普遍提高 瀏覽:753
政信類產品包括哪些 瀏覽:92
首套房怎麼交易劃算 瀏覽:38
m2對金融市場有什麼影響 瀏覽:416
代理如何開通頭條收益 瀏覽:260
長春麻將小程序在哪裡 瀏覽:272
抖音數據999從哪裡看 瀏覽:69
為什麼要在別人的直播間做數據 瀏覽:901
小程序骰子怎麼搖五個一 瀏覽:711
社區市場怎麼調中文 瀏覽:207
人事代理是什麼樣的 瀏覽:895
亞朵身心靈動的產品標准有哪些 瀏覽:419
北站雙興市場搬哪裡去了 瀏覽:204
駕駛員卡超時多久能來信息提示 瀏覽:292
債券在什麼平台交易 瀏覽:735
程序員配老師怎麼樣 瀏覽:840
力的產品是什麼 瀏覽:750
濟源職業技術學院動漫設計在哪個校區 瀏覽:395
屬於規定的電子數據有哪些 瀏覽:205
邯鄲引流推廣如何代理 瀏覽:396