728x90

오블완 8

cs285: lec 2, part 2

p12Behavioral cloning은 왜 실패할까?training trajectory (data)의 분포를 $p_{data}(o_t)$, 에이전트가 직접 운전하며 얻는 데이터를 $p_{\pi_{\theta}}(o_t)$라고 하자.여기서 문제는 policy가 학습된 분포 $p_{data}(o_t)$와 test되는 분포 $p_{\pi_{\theta}}(o_t)$가 다른 distribution shift가 생기긴다는 것이다.p13좋은 policy는 어떻게 측정할 수 있을까? $p_{data}(o_t)$ 같은 행동을 할 가능성이 높은 것?그것보단 훈련 데이터와 다른 상황에서도 좋은 행동을 할 수 있는 policy→ cost를 정의하자.cost: human driver와 행동이 같으면 0, 다르면 1이제 목표..

카테고리 없음 2024.11.16

11월 둘째주 회고

이번주는 참 바쁜 주간이었다! 1) 통계 중간고사2) IRB 제출 (오늘 할 것..)3) 첫 번째 팀 미팅 (🥲)4) 강화학습 스터디 특히나 가설 설정, IRB와 같이 연구의 가장 기반이 되는 파트를 짧은 시간에 뚝딱 해야했어서 부담이 많이 됐다,,그치만 뭐 어떻게든 해냈고.. 수업도, 과제도, 스터디도, 운동도.. 무엇도 도망치지않고 다 했다 !ㅠㅠ고생한 한 주였다..근데 이제 다음주엔 랩미팅 발표인.......흑흑다음주까지만 버텨보자...아좌

후기 2024.11.15

Two way ANOVA

Two way ANOVA는 테스트하는 변수가 두 개일 때 사용하는 방식이다.예를 들어 특정 병에 술과 담배가 미치는 영향 모두를 확인하고 싶을 때 사용한다.두가지 변수가 있다보니 각각의 independent variable이 response variable (종속변수)에 영향을 미치는지, 그리고 여기 더해서 두개의 independent variable 간의 상호작용이 있는지를 확인하게 된다.따라서 between group이 row, col, interaction 세가지로 나눠진다. SS와 df는 다음과 같이 계산한다. 필기는 2x3 상황을 가정하고 했다. between 상황에 대한 것이 위의 상황이라면, within 상황에는 Two-way RM ANOVA를 사용한다.앞서 말한 술과 담배가 여기 들어갈 수..

통계 2024.11.12

cs285: Lecture 2: Imitation Learning, Part 1

Part 1이 강의에서는 먼저 supervised learning에 대해 배울 것이다.p2-3Terminology & notationpolicy는 어떤 observation이 주어졌을 때 모든 가능한 action에 확률을 assign하는 분포이다. 특별한 경우 deterministic할 수도 있다.state와 observation은 다르다.state: 세계에 대한 정확하고 완전한 설명observation: 관찰할 수 있는 한정된 세계어떤 알고리즘은 모든 state가 필요한 반면 어떤 알고리즘은 observation으로도 충분하다.transition probability(dynamics): s_t에서 s_t+1으로 넘어갈 확률마르코프 속성: state는 이전 state에만 영향을 받는다.p5Imitatio..

카테고리 없음 2024.11.11

One way ANOVA (nonparametric)

구형성을 만족하지 않아도 되는 non parametric 방식으로는 Kruskal-Wallis method, Friedman rank sum test가 있다. Kruskal-Wallis method는 independent sample에 써서 Mann-Whitney U test에 대응하고,Friedman rank sum test는 correlated sample (within subject)에 사용해서 Wilcoxon signed rank sum에 대응한다. 두 방식 모두 SS_bg를 구한 후 H, 카이제곱 값을 구함으로써 계산한다.이 때 Kruskal의 N은 전체 subject의 수이고, Friedman의 K는 group 수 (measure 수) 라는 차이가 있다.두 경우 k의 의미는 조금 다르지만 모두..

통계 2024.11.10

one-way ANOVA (parametric)

통계분석 중간고사를 준비하며 정리한 내용이다.SS와 df를 통해 F값을 찾아야 하는데, SS, 특히 df를 구하는 법을 외워야 한다.F는 그룹 간 분산을 그룹 내 분산으로 나눈 값이다. 따라서 F값이 크면 그룹 간 분산이 크고 그룹 내 분산은 작으므로 그룹들이 서로 다르다고 할 수 있고, 반대의 경우 다르다고 하기 어렵다.F(df_G, df_E) = MSG / MSE로 구한다. 가설- H0: 모든 그룹 간 차이가 없다.- H1: 적어도 하나의 그룹은 다른 그룹과 다르다. 조건- 모든 observation이 랜덤하고 독립적으로 추출되어야 함- observation이 nearly normal하다- 그룹들의 분산이 같다 (sphericity) One way ANOVA One way repeated measur..

통계 2024.11.07
728x90