学习100个stata操作（31/100）

小孔读博日记 2024-07-23 12:33:37

今天介绍一个简单的小操作帮你3秒剔除重复数据。很多时候，由于我们数据处理过程中的某些原因，导致数据集中存在很多重复数据，此时需要我们剔除重复数据。操作如下：首先，我们需要对数据进行分组并排序，比如，我们的数据为个体-年度的面板数据，可以根据个体-年度进行分组，生成分组： egen idyear = group(id year) 此时，重复的数据就被分到了同一个组中，我们需要做的就是在每个分组中仅保留一个数据。然后，我们可以标记每个组中的第一个观测值 by idyear: gen to_keep = _n == 1 当然，如果你想保留每组的最后一个观测值，可以使用_n == _N来生成to_keep变量。接着，我们可以删除那些没有被标记的观测值 drop if to_keep == 0 此时我们已经删除掉了所有的重复数据，最后，删掉辅助变量： drop to_keep

0 阅读：0

评论列表

轻松熊

轻松熊

2

2024-07-25 10:01

用duplicates drop是不是更方便呢，请问这个方法和duplicates drop有区别吗？

小孔读博日记

感谢大家的关注

作者最新文章

1

好的论文：3分写，7分投

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

教育TOP

1

最近大学里面的事情有点扎堆啊前面南师大事情还没有完全解决，这不，中国药科大学又

2

大学生的浪漫，只有经历过才懂啊，挤在一起才是最舒服哒

3

确实漂亮，倾国倾城她不能进教室讲课，因为她一出现，学生根本不会听她讲课，而且还

4

大学生最新统计！按城市排列图！

5

10年6战法考终上岸的北大保安已辞职扫地僧是淡泊名利的隐藏高手。北大保安选择了考

6

老师穿成这样，学校不管吗？

7

这堂性教育课，为何让男生大方展示卫生巾？最近贵州毕节有个26岁的生物老师，把

8

满分作文，不言自语算是感情！

9

爱爬山的女教师。

10

高中进入高中后，有后劲的孩子分为两类。第一类，是中考成绩处于580分至680分

教育最新文章

1

大学生最新统计！按城市排列图！

2

英语名师何凯文开了直播了真是没想到他居然还有这个勇气最有意思的是，头发都

3

“真是骇人听闻！”一位家长发文指责，她说参加孩子学校举办的高考百日誓师大会，结果

4

一下扩招2万人，不少了！2025年大学扩招计划在陆续公布：武大计划本科招生7

5

清华扩招本科生，扩的还全是人工智能的，不知道和DeepSeek有没有关系。毕竟

6

这个30岁的北大保安逆袭成为律师！十年艰辛让无数人破防泪流！二本毕业的小伙刘

7

10年6战法考终上岸的北大保安已辞职扫地僧是淡泊名利的隐藏高手。北大保安选择了考

8

香港18岁中学女生真实的一面你的学校没有早读晚自习，简直是我的梦想

9

为什么全国高中突然那么急切的推行双休啊？这次高中双休，初中已经改了，早上上学

10

杭州开始打响第一枪！杭州市教育厅办公室发布通知：凡是在杭州市有工作的家庭，