Python序列化模型数据为JSON

nifhlheimr 发布于2019-07-25 10:33 / 1464人阅读

摘要：下面我们来说说如何使用来减轻序列化模型的工作量。主要包括如下个步骤定义模式序列化模型下面我们分别来看看。不得不说这个库对于序列化模型其实挺实用的。

原文地址:

http://52sox.com/use-python-serialization-orm-data-to-json/

相信使用Python做Web开发的朋友都会遇到这样1个问题,那就是在项目开发中使用模型框架,比如SQLAlchemy、Peewee,我们在做RESTful接口时如何将这些模型序列化为JSON数据。
关于这个问题,跟隔壁那位搞Python的哥们有关系。我不得不佩服这位哥们竟然自己写了1套ORM框架,而且用起来的那么遛,不得不让我汗颜。
但是,在给前端提供接口的时候,如何序列化为JSON数据确实困扰了我们那么一阵子,毕竟占据我们很大一部分时间来进行序列化操作。
这里,我们使用peewee来定义1个简单的例子来说明:

from peewee import SqliteDatabase
from peewee import Model, CharField, DateField, BooleanField, ForeignKeyField

db = SqliteDatabase("dev.sqlite3")

class BaseModel(Model):
    class Meta:
        database = db

class Person(BaseModel):
    name = CharField(max_length= 20)
    birthday = DateField()
    sex = BooleanField()

class Pet(BaseModel):
    owner = ForeignKeyField(Person, related_name= "pets")
    name = CharField(max_length= 10)
    animal_type = CharField(max_length= 20)

在这里我们定义了Person和Pet这2个模型,每个Person可能有1个Pet的宠物。
我们插入一些数据,现在假设我们现在有如下的数据:

sqlite> select * from person;
1|Bob|1960-01-15|1
2|Grandma|1935-03-01|0
3|Herb|1950-05-05|1
sqlite> select * from pet;
1|1|Kitty|cat
2|3|Fido|dog
3|3|Mittens|cat
4|2|Jack|cat

现在,我们假设我们接口需要返回的接口是每个用户的名称、生日及其对应的宠物的信息。
我们可以通过连表的方式轻松的获取到我们需要的数据:

query=Person.select(Person,Pet).join(Pet)

那么我们怎么将这个模型数据转换为我们需要的JSON数据呢?一般情况下,我们会这样操作:

data = []
for person in query.aggregate_rows():
    d={}
    d["username"] = person.name
    d["birthday"] = person.birthday
    d["pet"] = []
    for pet in person.pets:
        o = {}
        o["name"] = pet.name
        o["animal_type"] = pet.animal_type
        d["pet"].append(o)
    data.append(d)

最后我们将得到如下的结果:

[{"birthday": datetime.date(1960, 1, 15),
  "pet": [{"animal_type": u"cat", "name": u"Kitty"}],
  "username": u"Bob"},
 {"birthday": datetime.date(1950, 5, 5),
  "pet": [{"animal_type": u"dog", "name": u"Fido"},
   {"animal_type": u"cat", "name": u"Mittens"}],
  "username": u"Herb"},
 {"birthday": datetime.date(1935, 3, 1),
  "pet": [{"animal_type": u"cat", "name": u"Jack"}],
  "username": u"Grandma"}]

可以看到,这么1个简单的例子,我们已经对序列化操作处理的已经够呛的。对于那些更为复杂的模型,我们预计只有哭的份了。
因此,我们希望能找到1个库可以减轻我们的工作量,于是我们找到了1个marshallow的库。
下面我们来说说如何使用marshallow来减轻序列化模型的工作量。
主要包括如下2个步骤:

定义模式

序列化模型

下面我们分别来看看。

定义模式

如果你使用过Flask-RESTful,你应该知道该库提供了1个marshal_with的函数。其中我们就需要定义我们给定字段返回的数据类型,但是Flask-RESTful没有提供字段不同返回的操作。
我们通过如下的方式导入模式及其对应的字段:

from marshmallow import Schema, fields

接下来,我们定义1个继承自Schema的类,然后定义其对应的字段:

class PetSchema(Schema):
    name = fields.String()
    animal_type = fields.String()
    
class PersonSchema(Schema):
    name = fields.String(dump_to = "username")
    birthday = fields.Date()
    pets = fields.Nested(PetSchema,dump_to="pet",many=True)

由于这里,我们将用户的name属性修改为username,因此我们需要在字段中使用dump_to参数将其修改为我们需要的字段。另外,用户的pet字段对应的是宠物的信息,因此我们采用嵌套模式来实现这样需求。

序列化模型

上面我们已经定义好了我们的模式了,下一步是序列化模型的操作了。
我们可以这样来操作:

query=Person.select(Person, Pet).join(Pet)

接着,我们实例化我们的模式,然后传入需要序列化的模型:

person, error = PersonSchema(many = True).dumps(query.aggregate_rows())

在这里,我们调用PersonSchema实例的dumps来生成JSON数据,另外它还有1个dump方法用于生成Python对象。由于我们的渲染的数据有多条,因此我们需要在实例化PersonSchema类时传入关键字参数many为True,不然没有任何数据。
通过这种方式,PersonSchema会查看它自己的属性,将数据模型中对应的数据先序列化出来,然后是查询嵌套模式中的字段,如果符合对应的名称则将其序列化出来,最后我们将得到这样的数据:

[
    {
        "username": "Bob",
        "pet": [
            {
                "animal_type": "cat",
                "name": "Kitty"
            }
        ],
        "birthday": "1960-01-15"
    },
    {
        "username": "Herb",
        "pet": [
            {
                "animal_type": "dog",
                "name": "Fido"
            },
            {
                "animal_type": "cat",
                "name": "Mittens"
            }
        ],
        "birthday": "1950-05-05"
    },
    {
        "username": "Grandma",
        "pet": [
            {
                "animal_type": "cat",
                "name": "Jack"
            }
        ],
        "birthday": "1935-03-01"
    }
]

可以看到,通过marshallow得到的结果与之前我们编写的序列化操作的结果是一样的。
不得不说,marshallow这个库对于序列化模型其实挺实用的。当然对于复杂的模型,我们需要利用合适的方式将其搜索出来,不然还是序列化不了的。

参考文章:

https://marshmallow.readthedocs.io/en/latest/quickstart.html

GPU云服务器云服务器 json模型数据结构 js+json数据序列化反序列化json数据 js js解析json数据成模型

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/38028.html

TensorFlow 删除 YAML 支持，建议 JSON 作为替补方案！

摘要：据公告称，和的包装库使用了不安全的函数来反序列化编码的机器学习模型。简单来看，序列化将对象转换为字节流。据悉，本次漏洞影响与版本，的到版本均受影响。作为解决方案，在宣布弃用之后，团队建议开发者以替代序列化，或使用序列化作为替代。 ...

BlackFlagBin 2021-09-08 09:36 评论0 收藏0
使用Python构建自定义新闻源

摘要：在本文中，我们将学习构建自定义新闻语料库并分别注释与兴趣相对应的大量文章。为此，我们将使用。我们将使用另一个名为的免费服务。我正在使用单击创建触发器完成。我们将使用相同的调度库来运行我们在第章构建应用程序以查找廉价机票中使用的代码。 showImg(https://segmentfault.com/img/remote/1460000019191794); 来源 | 愿码(Chain...

paulli3 2019-07-31 10:25 评论0 收藏0
Django基础之七（数据库操作）

摘要：查询集表示从数据库中取出来的对象的集合。例如，返回包含数据库中所有对象的一个查询集。最后的结果仍然是一个查询集，它包含标题以开头发布日期在年月日至当天之间的所有记录。一般来说，只有在请求查询集的结果时才会到数据库中去获取它们。 Django数据库操作创建对象 Django 使用一种直观的方式把数据库表中的数据表示成Python 对象：一个模型类代表数据库中的一个表，一个模型类的实...

meislzhua 2019-07-31 11:19 评论0 收藏0
marshmallow快速上手

摘要：方法对应的是方法，它反序列化一个字典为数据结构。某些例如和内置了验证器验证集合时，错误字典将基于无效字段的索引作为键通过给的参数传递对象，可以执行额外的验证验证函数可以返回布尔值或抛出异常。快速上手 Declaring Schemas 首先创建一个基础的user模型(只是为了演示，并不是真正的模型)： import datetime as dt class User(object)...

jhhfft 2019-07-31 10:27 评论0 收藏0