모각공 4

[추천시스템설계] Factorizations Machines

작성자장원준일 시2024. 5. 23  (목) 18:00 ~ 21:00장 소복지관 b128-1호참가자 명단임혜진, 이재영, 성창민, 김명원, 장원준 사 진Latent Factor Models 의 한계점 Cold-start: 상호작용 데이터가 충분히 많지 않을 때 Interpretability: Feature는 model이 무엇을 하는지 해석하는데 도움이 됨 Temporal evolution: 선호도나 특성이 시간에 영향을 받는 경우  Factorization MachinesFeature간 관계를 모델링 Latent Factor Model의 Generalization User-Item 상호작용 뿐 아니라 feature들 사이의 상호작용도 모델링 가능! User-Item 상호작용은 여러 feature들 중 ..

카테고리 없음 2024.05.23

[추천시스템설계] User free models

작성자장원준일 시2024. 5. 16  (목) 18:00 ~ 21:00장 소복지관 b128-1호참가자 명단임혜진, 이재영, 성창민, 김명원, 장원준 사 진   User parameter 없는 모델링 하려면 어떻게 할  수 있을까?User parameter 가 없으면 좋은 이유User 마다 rank 만큼의 parameter가 필요한데 이렇게 되면 user 수가 많아졌을 때 메모리 사용량 과다해진다.상호작용이 적은 (ex. 선호도 표현을 적게한)  User 는 정확도가 낮다.User가 상호작용 할 때 마다 업데이트 해야한다.아이템 집합을 입력받고, 추천 아이템들을 출력하는 모델을 만든다면 User의 상호작용이 늘어나도 재학습 할 필요가 없다. 이를 통해 제안된 방법이 두가지가 있는데 먼저 처음은,SLIM (..

카테고리 없음 2024.05.16

[추천시스템설계] Implicit Feedback models

작성자장원준일 시2024. 5. 9  (목) 18:00 ~ 21:00장 소복지관 b128-1호참가자 명단임혜진, 이재영, 성창민, 김명원, 장원준 사 진Implic feedback 이란 사용자의 집적적인 평가나 선호도 평가 없이, 사용자의 행동으로부터 간접적으로 추론할 수 있는 데이터 이다. 예) 페이지 조회수, 구매 이력, 장바구니 추가, 스트리밍 시간, 클릭 기록 등이 있다. 위 데이터셋을 활용해서 Latent Factor Model 에 적용하면,   위와 같이 Binary Classification 으로 사용자가 시청을 할지 안할지를 판단한다. 없는 값을 0으로 간주하고, Logistic Regression 을 수행하면 *데이터의 불균형 -> 별점이 없는 데이터가 애매해짐*데이터의 거대함 -> 유저..

카테고리 없음 2024.05.09

[추천시스템설계] Finding Similar Items

작성자장원준일 시2024. 5. 2  (목) 18:00 ~ 21:00장 소복지관 b128-1호참가자 명단임혜진, 이재영, 성창민, 김명원, 장원준 사 진   아이템 간의 유사도를 측정하는 법은 매우 다양할 수 있다.    예를 들어  Jaccard Similarity 가 있다.  자카드 유사도는 집합간의 유사도를 측정 하는 것으로, 교집합에 합집합을 나누어주어서 그 유사도를 비교 한다. 다음으로는 Cosine Similarity 가 있다.  두벡터가 같은 방향을 바라보면 유사도 높은 것이다.   이제 위를 이용한 코드로 실습을 해볼 것이다.  !wget https://files.grouplens.org/datasets/movielens/ml-25m.zip !unzip ml-25m.zip 데이터셋을 불러..

카테고리 없음 2024.05.02