input
命令输入变量名和数据,或点击工具栏的“数据编辑器”图标手动输入。,3. 输入数据后,使用save 文件名
命令将数据集保存为.dta文件。在Stata中创建新数据库(通常称为数据集)是数据分析的基础操作,以下是详细步骤,涵盖命令和菜单两种方式,确保清晰易懂:
理解Stata中的“数据库”
Stata的核心操作对象是数据集(Dataset),而非传统SQL类数据库,新建数据集即创建一个空白表格,用于后续输入或导入数据,以下方法均适用于Stata 17/18等主流版本。
方法1:通过命令创建(推荐高效方式)
步骤1:打开Stata命令窗口
启动Stata,在界面底部的Command
窗口输入命令。
步骤2:清除当前数据(避免干扰)
clear all // 清空内存中已有数据
步骤3:创建空白数据集
set obs 0 // 设置观测值数量为0(即空数据集)
步骤4:添加变量(列)
gen var1 = . // 创建数值型变量var1,初始值为缺失值 gen str20 var2 = "" // 创建字符型变量var2,长度20字符
步骤5:验证结果
list // 显示数据,确认已创建含var1和var2的空表格
方法2:通过菜单创建(适合新手)
步骤1:打开数据编辑器
点击顶部菜单栏:Data > Data Editor > Data Editor (Edit)。
步骤2:添加变量
- 在编辑器界面,右键点击列名(如
var1
)。 - 选择Add Variables…。
- 输入变量名(如
age
),选择类型(numeric/string),点击OK。
步骤3:添加观测值(行)
- 在空白行直接输入数据(如第1行输入25、”John”)。
- 关闭编辑器时自动保存到内存。
从外部文件新建数据集(常用场景)
示例:导入Excel文件
import excel "C:/data/newfile.xlsx", sheet("Sheet1") firstrow clear // firstrow: 将首行作为变量名 // clear: 替换当前数据
支持格式
- CSV:
import delimited "data.csv", clear
- 文本:
insheet using "data.txt", clear
- SPSS/SAS:通过
import sas
/import spss
实现
关键操作:保存数据集
新建后务必保存,否则退出将丢失数据:
save "D:/project/new_data.dta", replace // replace覆盖同名文件
或通过菜单:File > Save As,选择路径及文件名(默认.dta格式)。
注意事项
- 变量类型:数值型(numeric)和字符型(string)需提前定义,避免后续错误。
- 内存管理:大型数据需用
set maxvar
或set obs
调整内存限制。 - 数据验证:用
describe
查看数据结构,browse
。 - 扩展应用:结合
input
命令手动输入数据:clear input id age 1 25 2 30 end
新建Stata数据集的核心是创建空白变量框架(通过命令或菜单),后续通过输入、导入或编程填充数据,始终遵循“创建-编辑-保存”流程,并利用help import
/help save
查看官方文档深化学习。
引用说明:本文操作基于Stata 17官方手册(Stata Press, 2021)及Stata Corp技术文档,菜单路径参照Stata 18 GUI界面,适用于Windows/macOS/Linux系统。
原创文章,发布者:酷盾叔,转转请注明出处:https://www.kd.cn/ask/37567.html