yaxt - xlab size in r




R applet 설명을 설명하십시오. (2)

나는 R에서 tapply ()가 무엇을하는지 이해합니다. 그러나 나는 문서에서이 설명을 파싱 할 수 없습니다 :

Apply a Function Over a "Ragged" Array

Description:

     Apply a function to each cell of a ragged array, that is to each
     (non-empty) group of values given by a unique combination of the
     levels of certain factors.

Usage:

     tapply(X, INDEX, FUN = NULL, ..., simplify = TRUE)

내가 tapply 생각하면, 나는 SQL에서 그룹별로 생각합니다. X의 값을 INDEX의 병렬 요소 수준으로 그룹화하고 FUN을 해당 그룹에 적용합니다. 나는 tapply의 묘사를 100 번 읽었고, 그것이 무엇이 tapply를 이해하는지에 어떻게 맵핑되는지를 이해할 수 없다. 아마도 누군가 나를 구문 분석하는 데 도움이 될 수 있습니까?


@ 조란의 위대한 대답은 나를 이해하는 데 도움이되었다. (그래서 그에게 투표 해주세요. 너무 길지 않았다면 주석으로 추가했을 것입니다.) 그러나 이것은 도움이 될 수 있습니다.

꽤 많은 언어에서, 당신은 2 차원 배열을 가지고 있습니다. 언어에 따라 이러한 배열의 치수는 고정되어 있습니다 (예 : 각 행의 열 수가 동일). 또는 일부 언어에서는 행당 항목 수가 다를 수 있습니다. 그래서 대신 :

A: 1  2  3
B: 4  5  6
C: 7  8  9

너는 뭔가를 얻을 수있다.

A: 1  3
B: 4  5  6
C: 8

이것은 불규칙한 배열이라고 불리는데, 그 오른쪽이 불규칙하게 보이기 때문입니다. 일반적인 R 스타일에서는 이것을 두 개의 벡터로 나타낼 수 있습니다.

values<-c(1,3,4,5,6,8)
names<-c("A", "A", "B", "B", "B", "C")

첫 번째 매개 변수 tapply 두 벡터를 사용하면 실제로이 함수를 비정형 배열의 각 '행'에 적용 할 수 있습니다.


R 문서 가 그 주제에 관해 무엇을 말하고 있는지 보자.

서브 클래스 크기가 불규칙 할 수 있기 때문에 벡터와 레이블링 요소의 조합은 때로는 비정형 배열이라고도 불리는 예입니다. 서브 클래스 크기가 모두 같을 때 다음 섹션에서 볼 수 있듯이 암시 적으로 훨씬 더 효율적으로 인덱싱을 수행 할 수 있습니다.

INDEX 를 통해 제공하는 요소 목록은 아마도 X 길이가 다른 X 의 하위 집합 (즉, '비정형'설명 자)의 모음을 지정합니다. 그런 다음 FUN 이 각 하위 집합에 적용됩니다.

편집 : @ 조리스는 코멘트에 훌륭한 포인트를 만듭니다. sapply(split(X,Y),...) 에 대한 래퍼로 tapply(X,Y,...) 를 생각하면 도움이 될 것입니다. Y가 그룹화 요소의 목록이면, 고유 한 레벨을 기반으로하는 단일 그룹화 요소는 그에 따라 X를 분할하고 각 조각에 FUN을 적용합니다.

편집 : 예를 들어 설명 :

library(lattice)
library(plyr)
set.seed(123)

#Make this example unbalanced
dat <- barley[sample(1:120,50),]

#Suppose we want the avg yield by year/site:
table(dat$year,dat$site)

#That's what they mean by 'ragged' array; there are different
# numbers of obs at each comb of levels

#In plyr we could use ddply:
ddply(dat,.(year,site),.fun=function(x){mean(x$yield)})

#Which gives the same result (listed in a diff order) as:
melt(tapply (dat$yield, list (dat$year, dat$site), mean))




aggregate-functions