STATA LÀ GÌ

     

1. Ra mắt về Stata

Stata là ứng dụng thống kê mạnh bạo với các phương tiện quản lý dữ liệu thông minh. Mục đích hoàn toàn có thể sử dụng làm nghiên cứu và phân tích trong quá trình làm luận văn, học các khoá học về định lượng cùng làm bài tập hoặc làm tiểu luận. Trong lí giải này, buoidienxanhha.com sẽ bước đầu với phần trình làng nhanh với tổng quan, sau đó trình làng 1 bài tập mẫu và bài bác giải về stata nhằm bạn hiểu rõ hơn.

Bạn đang xem: Stata là gì

Bạn đã xem: Stata là gì

Giao diện của Stata cơ bản như sau:


*

Giao diện Stata phiên bản 15

Ở bên trái bao gồm cửa sổ có tên "Command" là nơi các bạn nhập lệnh cho Stata. 

Ở giữa có cửa sổ Stata hiển thị công dụng trong cửa sổ lớn số 1 được điện thoại tư vấn là của sổ Kết quả.

Ở mặt phải gồm cửa số Biến(variables) liệt kê các biến vào tập tài liệu của bạn. Cửa sổ Thuộc tính (Properties) ở dưới hiển thị các thuộc tính của các biến cùng tập tài liệu của bạn.

2. Một trong những bài tập về stata


*

Bài tập stata

Bài giải tham khảo

Câu 1: giả sử nghiên cứu và phân tích tỷ lệ phạm nhân tại việt nam thì tế bào về phạm tội rất có thể nghiên cứu vớt bằng các yếu tố tác động như sau:

Theo những nhà tội phạm học vẫn xác định được nhiều yếu tố ảnh hưởng đến tỷ lệ tội phạm như yếu tố buôn bản hội, gớm tế, cá nhân. Một trong những yếu tố đặc trưng nhất được xác định bao gồm:

Tuổi: Theo những nhà tội nhân học, người cao quý không phạm tội những so cùng với thanh thiếu thốn niên. Bọn họ (các nhà tội phạm học) do đó cho rằng số lượng dân sinh thiếu niên có phần trăm tội phạm vô cùng cao.Nên gớm tê: một vài nhà tội phạm tin rằng một nền kinh tế nghèo nàn, GDP tốt là nguyên nhân gây ra phần trăm thất nghiệp cao và vì vậy gây ra tội phạm.Vấn đề xã hội: lúc mức độ của các vấn đề thôn hội tăng thêm như con số các gia đình phụ huynh độc thân, học sinh bỏ học hoàn toàn có thể gây tác động đến tư tưởng tội phạm.

Mô hình có thể là:


*

 

Câu 2:

a) Đồ thị trung tung fe tức là chi phí thức ăn và trục tung TE là tổng ngân sách chi tiêu như bên dưới.


*

*

Gọi sắt (food Expenditure) là biến phụ thuộc và TE (Total Expenditure) là biến độc lập ta được công dụng mô hình như sau:

Source

SS df

MS

Number of obs =

55

 

F( 1, 53)

= 31.10

  

Model

139022.82

1 139022.82

Prob > F

= 0.0000

Residual

236893.616

53 4469.69087

R-squared

= 0.3698

 

Adj R-squared

= 0.3579

  

Total

375916.436

54 6961.41549

Root MSE

= 66.856

     

fe

Coef.

Xem thêm: Hướng Dẫn Cách Tìm Facebook Qua Tên Và Ngày Sinh, Cập Nhật Tính Năng Mới

Std. Err. T

P>t

     

te

.4368088

0.000 .2797135

.593904

_cons

94.20878

50.85635 1.85

0.070 -7.796134

196.2137

 

Ta được quy mô hồi quy toàn diện và tổng thể đó là

FE= 94.20878+ 0.436809FE +u

Câu 3:

a)

Kết qua quy mô giữa ln(wage) và educ như sau:


Ta thấy hệ số cân xứng R-squared là 0.1858 ta thấy ý nghĩa rằng giáo dục giải thích 22% của phát triển thành lnwage

Hệ số p-value =0 chứng tỏ nếu chu chỉnh R2 ≠0 . Thường thì nếu p-value =0 hoàn toàn có thể kết luận quy mô là có ý nghĩa quan hệ giữa ln(wage) với edu có nghĩa là giáo dục có mối quan hệ với logarit tiền lương.

Ta rất có thể viết lại quy mô hồi quy như sau:

Ln(wage)= 0.5837727 + 0.082744 educ +u

b)

Ta có mô bên cạnh đó sau:

wage= -0.9048516 + 0.5413593*educ +u

Ta được hiệu quả và trang bị thị sau:

Trong đó hệ đường cao hơn nữa là đường wage và thấp hơn là ln(wage). Ta thấy thông số thấp hơn chính vì mô hình hổi quy ln trong một quy mô hồi quy là một trong cách rất thịnh hành để cách xử lý các trường hợp mà một mối quan hệ phi tuyến tồn trên giữa những biến độc lập và phụ thuộc. Sử dụng logarit để đánh giá cho mọt quan hệ tác dụng phi con đường tính.. Cho nên vì vậy hệ số góc của quy mô ln đã thấp hơn quy mô tuyến tính không phải logarit.

Câu 4.

/* thiết lập cấu hình 100 quan gần cạnh */

set obs =100

/* tùy chỉnh x từ là một đến 100 */

 

gen x=_n

/* chế tạo ra u với hàm phân phối chuẩn có độ lệch tiêu chuẩn là 9 và trung bình là 0 */

gen u= rnormal(0,9)

/* tạo thành y */

gen y= 25+ 0.5*x+u

regress y x

/*Sau đó lặp lại để xem sự thay đổi */

. Replace u=rnormal(0,9)

(100 real changes made)

. Replace y=25+0.5*x+u

(100 real changes made)

. Regress y x


Bảng 50 biến hệ số và hằng số của mô hình bên dưới:

STT

Hệ số

Hằng số

1

0.559146

22.01877

2

0.496917

24.47293

3

0.559421

23.08086

4

0.477793

25.17664

5

0.634216

24.43563

6

0.531187

23.03467

7

0.579003

25.34174

8

0.434642

24.59241

9

0.425048

23.10669

10

0.655447

25.23225

11

0.545225

24.72915

12

0.440208

23.00782

13

0.462175

25.05967

14

0.534416

24.75997

15

0.486741

23.10199

16

0.583187

25.22057

17

0.503988

24.88844

18

0.407302

22.9527

19

0.701233

25.26039

20

0.528918

24.92657

21

0.428679

22.97768

22

0.775209

25.26597

23

0.680537

25.00867

24

0.499697

22.91682

25

0.579524

25.30272

26

0.505199

25.14032

27

0.437763

22.79972

28

0.458293

25.18758

29

0.510882

25.21255

30

0.412656

22.6339

31

0.415013

25.35426

32

0.655899

25.30749

33

0.437684

22.78882

34

0.401382

25.34872

35

0.656958

25.31893

36

0.419503

22.88048

37

0.426417

25.42346

38

0.425212

25.30239

39

0.401355

22.73032

40

0.484928

25.43568

41

0.436463

25.40308

42

0.412919

22.8271

43

0.414379

25.30417

44

0.499664

25.22376

45

0.401093

22.83304

46

0.440595

25.42079

47

0.445569

25.30174

48

0.440272

22.91587

49

0.488007

25.24615

50

0.472239

25.20093

 

Câu 5:

Trị số P, dù cực kì thông dụng trong nghiên cứu khoa học, ko phải là một trong phán xét sau cùng của một dự án công trình nghiên cứu hay 1 giả thuyết.

Thông hay khi công ty khoa học mong kiểm tra coi liệu phụ gia thực phẩm có gây ra ung thư hay thuốc trị bệnh, bên khoa học cho rằng nó ko - mang thuyết ko - và tiếp đến thực hiện tại thử nghiệm đối chiếu thuốc hoặc dung dịch với giả dược hoặc một loại thuốc khá. Nếu có khá nhiều người tồn tại hơn với thuốc so với mang dược, thì nhà công nghệ sẽ kết luận thuốc sẽ vận động tốt. Điều này cũng hoàn toàn có thể xảy ra giúp thấy rằng các công dụng này cũng hoàn toàn có thể mang tính may mắn.

Xem thêm: Thứ 7, Chủ Nhật Có Đăng Ký Xe Máy Vào Những Ngày Nào Trong Tuần 2022

Thật vậy, nếu bọn họ chịu cực nhọc xem xét lại lấy một ví dụ trên, chúng ta cũng có thể khái quát các bước của một nghiên cứu khoa học (dựa vào trị số P) như sau:

• Đề ra một giả thuyết thiết yếu (H)

• Từ trả thuyết chính, đặt ra một mang thuyết hòn đảo (Ho)

• Tiến hành tích lũy dữ kiện (D)

• so sánh dữ kiện: giám sát xác suất D xẩy ra nếu Ho là sự thật. Nói theo ngôn ngữ toán xác suất, bước này xác minh P(D | Ho).

Vì thế, con số P có nghĩa là xác suất của dữ kiện D xẩy ra nếu (nhấn mạnh: “nếu”) giả thuyết đảo Ho là sự thật. Như vậy, con số P ko trực tiếp cho họ một ý niệm gì về thực sự của giả thuyết thiết yếu H; nó chỉ con gián tiếp cung ứng bằng hội chứng để chúng ta chấp dìm giả thuyết chính và chưng bỏ trả thuyết đảo

Tài liệu cơ bản về Stata bao gồm Help của Stata với Hướng dẫn tìm hiểu thêm cơ sở ( Base Reference Manual) về từng mục béo của Stata từ thống trị dữ liệu, Đồ họa với Chức năng... Các bạn có thể tham khảo các sách như Acock - A Gentle Introduction to StataLawrence Hamilton- Statistics with StataScott Long và Jeremy Freese- Regression Models for Categorical Dependent Variables Using Stata (3rd edition);