Thông tin chung về Dataset

  • Tổng số người làm khảo sát: 422
  • Thành phần giới tính: 288 đối tượng thuộc nhóm Nữ (khoảng 68%), 89 đối tượng thuộc nhóm Nam (khoảng 21%) và 45 đối tượng thuộc nhóm LGBTQ+ (khoảng 11%).
  • Thành phần du học sinh: 155 đối tượng đã/đang Du học/Trao đổi ở nước ngoài (khoảng 36.7%), 267 đối tượng chưa từng Du học/Trao đổi ở nước ngoài (khoảng 63.3%).
  • Độ tuổi và trình độ học vấn: Phân bố khá rộng, chủ yếu là những người trong độ tuổi từ 19 đến 23, hiện đang theo học hoặc vừa tốt nghiệp Đại học. Chi tiết số lượng từng nhóm sẽ được ghi rõ hơn ở dưới.

Lưu ý về Report

Report này sẽ chỉ bao gồm những cập nhật quan trọng và đáng kể so với report ngày 4 tháng 7 năm 2020. Vì vậy, một số visualization bị lược bỏ nếu:

  1. Data mới xác minh những kết luận cũ (trong trường hợp này, xem ở ĐÂY)
  2. Visualization không còn quan trọng hoặc phù hợp. (Ví dụ như số lượng khảo sát nhận được theo giờ trước và sau khi đăng post giới thiệu dự án vào ngày 30 tháng 6.)

Report

Số lượng khảo sát nhận được qua từng ngày xuyên suốt dự án

Key insights:

Xuyên suốt dự án, lượng khảo sát nhận được thường tăng đột biến sau những viral post như post giới thiệu về dự án ngày 30 tháng 6 và post data visualization về những khó khăn khi tìm kiếm đối tượng hẹn hò ngày 8 tháng 7. Sau đó, lượng khảo sát nhận được giảm dần và chỉ tăng khá nhẹ sau khi đăng một số bài về Sự kiện “Đồng Vị” ngày 18, 26 và 30 tháng 7.

Mối liên quan giữa độ tuổi và thời gian hoàn thành khảo sát

Như trong report trước, khi chạy boxplot(log(df$Duration)) trên dữ liệu mới, số lượng ngoại lai (outliers) tăng lên đáng kể – đến mức mà cũng không chắc những giá trị này có thể được coi là ngoại lai không nữa. Nhưng để đầy đủ và đúng “quy trình” :laughing: thì Hương vẫn sẽ loại bỏ những ngoại lai này.

Sau khi loại bỏ ngoại lai, mối quan hệ giữa độ tuổi và thời gian được làm khảo sát được thể hiện trong biểu đồ sau:

Key insights:

Correlation Coefficient Before eliminating outliers After eliminating outliers
Values 0.02654559 0.1139821

Scatterplot này nhìn khá kỳ một phần bởi vì mình giới hạn độ tuổi người làm khảo sát từ 18 tuổi trở lên, tuy nhiên trục x vẫn cần bắt đầu từ 0 để phản ánh đúng xu hướng của các scatter. Theo như biểu đồ cũng như các hệ số tương quan (correlation coefficient) được ghi ở trên, mặc dù hệ số tương quan có tăng thêm một chút sau khi loại bỏ ngoại lai (từ 0.03 lên 0.11), những con số này vẫn rất nhỏ và gần với 0. Vì vậy, kết luận là không có mối liên hệ nào giữa tuổi của người làm khảo sát và thời gian họ hoàn thành khảo sát.

Các thông tin liên quan đến giới tính của người làm khảo sát

Key insights:

  • Về độ tuổi: Giống như đã đề cập ở report trước, sự phân bố giới tính diễn ra khá đồng đều giữa hầu hết các độ tuổi. Thêm vào đó, hầu hết những người làm khảo sát rơi vào độ tuổi giữa 20 và 24. Sự khác biệt lớn nhất là dự án đã thu hút được thêm nhóm đối tượng từ 25 trở lên làm khảo sát trong khoảng thời gian từ giữa tháng 7 đến đầu tháng 8.
  • Về trình độ học vấn: Phần này cũng khá tương tự với đã đề cập ở report trước. Tức là hầu hết người làm khảo sát đều nằm trong nhóm đối tượng đang theo học hoặc đã tốt nghiệp Đại học. Trong khoảng thời gian từ giữa tháng 7 đến đầu tháng 8, dự án cũng đã thu hút thêm kha khá Nam giới trong các nhóm trình độ học vấn này làm khảo sát. Cụ thể, số lượng đối tượng Nam đã vượt số lượng đối tượng LGBTQ+ đáng kể.

Các thông tin liên quan đến chi phí mà người làm khảo sát sẵn sàng chi trả cho một buổi hẹn hò

1. Nhận xét chung

Dựa trên dữ liệu khảo sát mới thì nhiều người sẵn sàng chi trả nhiều tiền hơn là ít tiền cho buổi hẹn hò đầu tiên. Trong report tháng 7, số lượng những người sẵn sàng chi trả 150,000 VNĐ - 200,000 VNĐ là đông đảo nhất. Tuy nhiên, lần này số lượng người sẵn sàng chi trả trên 200,000 VNĐ đã tăng nhiều và chiếm ưu thế (hơn gấp 3 lần, từ khoảng 45 lên khoảng 150.)

2. Nhóm giới tính và nhận định về chi phí

Dựa trên hai biểu đồ này có thể thấy tỷ lệ khá tương đương trong nhận định về chi phí giữa nhóm đối tượng Nữ và nhóm đối tượng LGBTQ+. Cụ thể, tỷ lệ những người sẵn sàng chi trả 150,000 VNĐ - 200,000 VNĐ và tỷ lệ người sẵn sàng chi trả trên 200,000 VNĐ gần như bằng nhau trong hai nhóm giới tính này (khoảng 27%). Tuy nhiên, đối với nhóm đối tượng Nam, đại đa số người làm khảo sát sẵn sàng chi trả trên 200,000 VNĐ cho buổi hẹn hò đầu tiên. :wink:

3. Nhận định về chi phí dựa trên những yếu tố khác

  • Về trải nghiệm du học: Dựa trên dữ liệu mới, xu hướng về chi phí cho buổi hẹn hò đầu tiên giữa nhóm đối tượng đã/đang du học và nhóm đối tượng chưa từng du học khá giống nhau. Cụ thể là đa số sẵn sàng chi trên 150,000 VNĐ cho buổi hẹn hò đầu tiên. Số lượng người sẵn sàng chi trả 200,000 VNĐ là cao nhất trong mỗi nhóm (mặc dù trong nhóm không phải du học sinh thì sự áp đảo này được thể hiện rõ hơn một chút. :thinking:)
  • Về độ tuổi: Số lượng những người sẵn sàng chi trả trên 150,000 VNĐ và trên 200,000 VNĐ thường cao hơn ở nhóm tuổi hơn 24 tuổi. Giả định là bởi vi những người trên 24 tuổi đều là những người đã tốt nghiệp Đại học, đang đi làm và tự chủ về tài chính nên họ sẵn sàng chi trả nhiều tiền hơn cho buổi hẹn hò đầu tiên? :money_with_wings: Nhóm độ tuổi từ 19 đến 23 tuy đông đảo hơn về số lượng người làm khảo sát, tuy nhiên dựa trên biểu đồ thì hầu hết sẵn sàng chi trả tầm 100,000 VNĐ - 200,000 VNĐ cho buổi hẹn đầu tiên – hợp lý với túi tiền học sinh. :nerd_face:
  • Về trình độ học vấn: Biểu đồ này bổ trợ cho những quan sát và kết luận ở biểu đồ độ tuổi. Cụ thể, đối với nhóm đối tượng vẫn đang đi học (từ cấp 3 đến Đại học), đa số người làm khảo sát trong mỗi nhóm sẵn sàng chi trả 100,000 VNĐ - 200,000 VNĐ cho buổi hẹn hò đầu tiên. Còn đối với nhóm đã tốt nghiệp Đại học trở lên thì tỷ lệ lớn sẽ sẵn sàng chi trả đến hơn 200,000 VNĐ cho buổi hẹn hò đầu tiên. :money_with_wings:

Tầm quan trọng của trình độ học vấn/nghề nghiệp và khả năng tài chính của đối phương đối với người làm khảo sát

Key insights:

Correlation Coefficient
0.631754

Dữ liệu mới vẫn thể hiện là có một chút liên hệ giữa tầm quan trọng của trình độ học vấn/nghề nghiệp và khả năng tài chính của đối phương đối với người làm khảo sát. Tuy nhiên, hệ số tương quan đã giảm từ 0.71 ở report trước xuống còn 0.63 từ report này. Điều này có nghĩa là cái linear relationship này yếu hơn một chút… nhưng vẫn trên 0.5 nên vẫn tính là có ha. :hand_over_mouth:

Độ sẵn sàng nghiêm túc với một mối quan hệ

Key insights:

Dựa trên dữ liệu mới thì cái biểu đồ này nó mấp mô hơn rất nhiều. :sweat_smile: Nhìn chung thì nhóm đối tượng Nam vẫn có độ sẵn sàng nghiêm túc với một mối quan hệ cao nhất, sau đó đến nhóm đối tượng Nữ và LGBTQ+ (thứ tự của hai nhóm sau này ngược lại so với report tháng 7.) Độ nghiêm túc của cả 3 nhóm trung bình vẫn ở khoảng 60 đến 75. Tuy nhiên, đầu hết người làm khảo sát trong nhóm đối tượng Nam thì có độ nghiêm túc từ 75 đến 100. trong khi đó, độ sẵn sàng nghiêm túc của nhóm đối tượng Nữ phân bố khá phức tạp ở khoảng 50, 75 đến 100. Nhưng đại đa số vẫn trên 50 nha. :wink: Đối với nhóm đối tượng LGBTQ+ thì độ sẵn sàng trải rộng hơn một chút. Cụ thể là tỷ lệ những người làm khảo sát với độ sẵn sàng từ 0 đến 40 cao hơn hẳn hai nhóm còn lại, và tỷ lệ những người làm khảo sát với độ sẵn sàng trên 40 thì thấp hơn hẳn hai nhóm còn lại. :thinking: