Segmentation 2

[Multi-modal] PhraseCut / VGPhraseCut Dataset 소개

PhraseCut: Language-based Image Segmentaiton in the Wild 2020년 발표된 Dataset + multimodal segmentation framework 를 제시한 논문이다. Visual Genome의 Bounding Box annotation을 활용해, Phrase와 그에 해당되는 region을 mask annotation 했다. Visual Genome이 어떤 dataset인지, PhraseCut은 어떤 modification을 적용했는지 알아보자~~! ** Phraes Cut의 HulaNet 모듈에 관한 설명은 해당 글에서 다루지 않습니다! Visual Genome. PhraseCut의 baseline PhraseCut의 base가 되는 Visual Ge..

[졸업프로젝트] Smart farm using Drone an AI : Grape berry counting & Grading

안녕하세요 오늘은 요즘 진행중인 졸업프로젝트에 관해서 포스팅하려 합니다. 프로젝트는 기술적으로 4가지 파트로 나뉩니다. AI, Drone, Front/Backend. 그 중에서도 제가 맡은 AI부분에 집중해서 설명해보도록 하겠습니다. 1. 왜 포도인가요? 많고 많은 작물,과수 중에 포도를 선택한 이유는, 가장 노동집약적인 작물이라고 판단했기 때문입니다. 포도의 특성상, - 대규모 농가의 비율이 큼(와이너리) - 세계적으로 재배되는 작물 - 재배에 인간의 노하우가 많이 필요함 -> 노동자의 숙련도가 중요하다. 대규모 농가에서 노동자의 숙련도가 필요한 작업을 하려면 비용이 올라가고, 작업이 연장됩니다. 한정된 인원으로 제공할수 있는 노동력또한 한정적이기 때문이지요. 결과적으로 비용이 증가하고 품질관리가 미흡..